WEB PR （無料カテゴリー登録サービス）

『教育評価とChatGPT：統計アプローチによる実証的研究』 2023年5月26日 ChatGPT研究日本で4報目となる学術的論考を発表

2023年 6月 01日(木曜日) 15:04

はじめに　――――――――――
　和歌山信愛女子短期大学の保育科教員である渡辺直人が、ChatGPTに関する学術的論考を発表しました。これは、日本では4報目となるChatGPTにおける実証的研究となります。論文は日本のプレプリントサーバーである「Jxiv」にて、2023年5月26日に一般公開されています。なお、準備が整い次第、英訳後に海外のOASPAにも投稿される予定になっています。

論文の概要　――――――――――
　昨今では、ChatGPTが飛ぶ鳥を落とす勢いで普及し、高い評価を得ております。しかしながら、ChatGPTに関する学術的検討はほとんどないままに広がっており、昨今では多くの問題が浮き彫りとなってきております。早急な基礎研究が求められる昨今、本研究ではChatGPT（ver.3.5）の評価能力（文章評価）を検証しました。

　研究の手続きですが、まず報道レポート・記事を100本無作為に抽出しました。それらをChatGPTに100点満点で、1本につき3度評価させました。3度評価させたのち、点数を降順で「High」「Middle」「Low」の3群に分けました。分析では、その3群を対象にFriedman検定及びHolm法多重比較を行いました。

　ここで、1点仮説が浮かび上がります。ChatGPTが高い信頼性を得ているというのであれば、評価得点は3度とも相違ない点数が返されるはずです。　（仮説：3群間に差はない。）

　しかしながら、集計のの結果、3群の平均値にはばらつきがあり、Friedman検定、そしてHolm法多重比較の結果においても、3群間全てのペアで有意な差があることが認められました（p<.01）。すなわち、仮説は棄却され、3群間に差があることが認められました。

　結論、この結果から、ChatGPT（ver.3.5）の評価はばらつきがあり、安定していないことが示されました。教育の評価にも応用することは難しいことが示されました。

結び　――――――――――
　本研究・ChatGPTに興味を持たれた方におかれましては、ぜひお問い合わせ、または取材に来ていただければ幸いです。いつでもお受けいたします。　（お問い合わせ先は以下を参照）

本研究に関して　お問い合わせと情報　―――
『教育評価とChatGPT：統計アプローチによる実証的研究』
DOI: https://doi.org/10.51094/jxiv.376
URL：https://jxiv.jst.go.jp/index.php/jxiv/preprint/view/376
〒640-0341 和歌山県和歌山市相坂702-2
和歌山信愛女子短期大学
保育科　講師（専任）　渡辺直人
EMail：nwatanabe＊shinai-u.ac.jp
TEL：073-479-3330

＊＝＠に変換してください。

登録者：nwatanabe

カテゴリー: プレスリリース配信