SlideShare a Scribd company logo
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
LLM を用いた俳句推敲と
批評文生成に関する研究
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士課程 2 年 冨澤 峻己
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
2
研究背景
芸術分野において,人間は「選択」「推敲」「批評」
を通して作品の価値を発見・向上
「選は創作なり」(高浜虚子)
推敲を重ねた作品を相互に見せ合い,感性や技術を磨く
言語モデルによる俳句の生成 [1][2]
芸術分野の 1 つとしての研究
AI の感情理解や俳句の新たな表現の可能性を示唆
[1] Kikuchi, S., Kato, K., Saito, J., Okura, S., Murase, K., Yamamoto, T. and Naka- gawa, A.: Quality Estimation for Japanese Haiku Poems Using Neural
Network, IEEE2016 (2016).
[2] Jimpei Hitsuwari, Yoshiyuki Ueda, Woojin Yun, and Michio Nomura. Does human– AI collaboration lead to more creative art? Aesthetic evaluation of
人工知能技術を用いて芸術分野に取り組む上で、
生成作品を選択・推敲・批評することが重要
課題 生成句の推敲と選択
特徴を適切に解釈した俳句の批評
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
3
俳句を相互評価する場「句会」
各々が指定された題に基づいて作成した俳句を持ち
寄り、相互評価を行う
題:兼題(季語)の指定、季節の俳句
相互評価:特選・並選などの選、批評
作句
作句
作句
選句 批評
俳句一覧
題
題に基づく俳句を複数作り,
その中から提出する作品を決める
選を入れた俳句の長所や
出来栄え、感想などを述べる
良いと感じた他者の
俳句に選を入れる
句会の流れ
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
4
俳句を相互評価する場「句会」
各々が指定された題に基づいて作成した俳句を持ち寄り、
相互評価を行う
題:兼題(季語)の指定、季節の俳句
相互評価:特選・並選などの選、批評
句会のプロセス
作句
作句
作句
選句 批評
俳句一覧
題
本研究のアプローチ
作句
批評
生成句からの題に基づく選択と推敲
長所や出来栄えを評価する批評文生成
[3] Kodai Hirata and Soichiro Yokoyama, Tomohisa Yamashita, and Hidenori Kawa- mura. Implementation of Autoregressive Language Models for
Generation of Seasonal Fixed-form Haiku in Japanese. KICSS2022, 2022.
• 言語モデルによる約 1 億句の生成句 [3] から選択・推
敲
• AI 俳句と題して本研究室で 2017 年から着手
生成句 DB
GPT-2
選択・推敲 推敲俳句
既存研究 本研究
Web 上の
約 50 万句 学習 生成 取得 推敲
句会で選を得た生成句の例
洗ひたる硯の海の涼しさよ
山吹の黄を極めたる蕾かな
戦争を語りつくしてトマト食む
万緑を破りて風のなかにゐる
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
5
研究目的
多数の生成句から題に基づいた俳句を選択・推敲する手
法の開発
GPT-2 による多数の生成句を活用
俳人の推敲プロセスに基づく LLM による選択・推敲
選択された俳句の質の検証
俳句の長所や出来栄えを評価する批評文生成手法の開発
俳人作の批評文に基づく LLM による批評文の生成
生成文の内容・質の検証
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
6
俳句
日本の伝統文芸「俳句」
季語を 1 つ含み、 5-7-5 の 17 音で構成される定型詩
作者は目に映った情景を 17 音に込め、感情を示唆する
蛙が池に飛び込む音が聞こえてくるほど静かだ
鑑賞者は俳句に込められた情景や心情を読み解く
水音を一瞬に過ぎない人間の生涯に例え、その虚しさや大切さを
説いている
最も有名な俳句の 1 つ(松尾芭蕉, 1686
年)
古池や蛙飛び込む水の音
芭蕉
非常に難しい作業
俳句を介した情景や心情の共有
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
7
データベース中の生成句と俳句の推敲
本研究で扱う生成句の課題
似通った古風な表現を含む俳句が多数
Web 上で収集した学習データに起因
現代句会において評価されづらい傾向
現代的な俳句への推敲例
寒鴉いつもの声で鳴きにけり
毎日を同じ声して寒鴉
春の雪ちぎれちぎれに降ちにけり
風鈴の音のしきりに鳴りにけり
満開の桜の下にかくれけり
現代的な俳句にする必要
方法 1
現代的な俳句を収集・学習させ,生成
方法 2
既存の生成句を現代的な俳句へ変換
学習データ不足により
不可能
少数の事例があれば
LLM により可能
俳句の推敲
一度できた俳句をより目的にあった俳句に
するために字句を吟味して練り直すこと
本研究では現代的な俳句にすることを目的と設定
古風な生成句の例
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
8
俳句の推敲手法
俳人へのヒアリングにより現代的な俳句への推敲のた
めに変更が必要な作業を決定
古風→現代的な俳句に関する作業
旧仮名遣い→新仮名遣い
切れ字→動詞,形容詞など他の表現
文語表現→口語表現
一般的に行う作業
語句の入替
句意の分析
LLM を用いた Few-shot CoT Prompting による俳句推敲
俳人の推敲プロセスに基づく 3 つの入出力例を設計
入力:選択対象の生成句 5 句,入出力例
出力:推敲後の俳句
項目 例
旧仮名遣い ゐる、しづか
切れ字 かな、けり
文語表現 消えたる、寂しき
俳
句
選
択
古
典
表
現
特
定
旧
仮
名
遣
い
変
更
句
意
分
析
切
れ
字
変
更
文
語
表
現
変
更
語
句
入
替
句
意
再
分
析
俳
句
推
敲
俳
句
Input
Output
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
9
俳句の推敲手法
俳人へのヒアリングにより現代的な俳句への推敲のために
変更が必要な作業を決定
古風→現代的な俳句に関する作業
旧仮名遣い→新仮名遣い
切れ字→動詞,形容詞など他の表現
文語表現→口語表現
一般的に行う作業
語句の入替
句意の分析
LLM を用いた Few-shot CoT Prompting による俳句の推敲
俳人の推敲プロセスに基づく入出力例を設計
入力:選択対象の生成句 5 句,入出力例
出力:推敲後の俳句
項目 例
旧仮名遣い ゐる、しづか
切れ字 かな、けり
文語表現 消えたる、寂しき
俳
句
選
択
古
典
表
現
特
定
旧
仮
名
遣
い
変
更
句
意
分
析
切
れ
字
変
更
文
語
表
現
変
更
語
句
入
替
句
意
再
分
析
俳
句
推
敲
俳
句
Input
Output
推敲過程の例
冬の海恐ろしきまで澄みにけり
冬の海恐ろしきまで澄んでいる
冬の海恐ろしいまで澄んでいる
恐ろしいまで澄んでいる冬の海
切れ字変更
文語表現変更
語句入替
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
10
俳句選択手法
俳句選択手法の概要
入力:題(文字列)
出力:推敲後の俳句
冬の句
情景生成
キーワード
生成
俳句取得
俳句選択
俳句 DB
LLM
Input
Output
LLM
LLM
冬の海恐ろしきまで澄みにけり
題から想像される情景や
場面の説明文を 10 個生成
題と情景に基づく
単語を 10 個生成
各キーワードを含む
俳句を取得
選択対象の俳句を評価・推
敲し、段階的に俳句を選択
俳句推敲
LLM 恐ろしいまで澄んでいる冬の海
データベースから
選択した生成句
推敲後の俳句
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
11
俳句の批評文
俳人が批評文を作成するには多大な労力が必要
俳句の本質や出来栄えを評価し,数百文字に言語化
数百句~数千句の応募がある公募企画において,一般的に上位数 % に
のみ付与
最も字数の多い批評文に関しては上位 1% 未満
本来は句会・公募企画の全作品に対して作成することが理想
参加者の満足度・技術力向上,新しい視点・価値観の取得, etc.
本研究で扱う批評文
俳句 批評文
句会や公募企画で最優秀作品に対して俳人が作成
する,作品の長所や出来栄えを評価する文
こほろぎや診察長き妻を待つ 秋に鳴く虫のなかで最も身近なものの一つが蟋蟀
でしょう。初秋から鳴きはじめて、...
...
夫人を思いやり、不安になる作者の心情を思うと、
蟋蟀の鳴き声がいっそう哀切に聞こえてきました。
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
12
生成する批評文の決定
俳人が最優秀句に対して作成した批評文を収集し,
「字数」「文調」「述べている要素」を分析
HAIKU 日本大賞 [4] ,白鳥庭園俳句大賞 [5] の計 32 文
要素 説明
1 特徴的な語句や表現 特徴的な語句や表現を指摘し、その効果や良さを説明
2 現実における具体例 俳句や一部語句から想像される現実で起こり得る事象を具体的に説明
3 季語の使い方 季語を取り上げ、季語そのものやその効果を説明
4 リズムと音 リズムや読み(音)に着目しリズム感の良さやバランスについて説明
5 意味の解釈 俳句の内容や作者が込めたであろう事象の解釈を説明
6 情景の解釈 俳句や一部語句から想像される情景や場面の解釈を説明
7 作者の心情の解釈 俳句や一部語句から想像される作者の心情の解釈を説明
8 全体としての感想 俳句全体から受ける印象や俳句を詠むことによって感じたことを説明
• 270~320 字,丁寧語,以下の 8 要素のうち 4~6 要素を
含む
• 同一企画内での文頭,要素構成,言い回しなどの多様性
結果
[4] HAIKU 日本 , https://haikunippon.net/ (2025 年 1 月 27 日閲覧 )
[5] 白鳥庭園俳句大賞 , https://www.shirotori-garden.jp/haiku/ (2025 年 1 月 27 日閲覧 )
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
13
批評文生成手法
LLM を用いた Few-Shot CoT Prompting による批評文生成
俳人作の批評文を利用した 3 つの入出例を設計
入力:俳句,入出力例,過去に生成した批評文と構成
出力:批評文章
語
句
分
析
過
去
文
の
構
成
分
析
要
素
選
択
強
調
要
素
選
択
要
素
構
成
決
定
過
去
文
の
表
現
分
析
批
評
文
生
成
Input
Output
批
評
文
俳
句
群
俳
句
多様性の確保
• 4~6 個の要素選択
• 構成順序の決定
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
14
実験①俳句選択手法の性能検証
目的
俳句選択手法により選択した推敲後の俳句の質を検証
推敲後の俳句が現代的な口語俳句に推敲されたかを検証
方法
題を「冬の句」として 20 句を選択
アンケート調査用の俳句を収集(右表)
評価方法
収集した俳句について俳人 11 名へのアンケート調査
題に基づいているか
俳句の基本的な項目を満たしているか
意味,文法,句節の繋がり
句会で選を得るか
生成句について俳人 3 名へのヒアリング調査
現代的な俳句へと推敲されているか
モデル
OpenAI API gpt-4o-2024-11-20
収集した俳句 ( 数 )
生成句 (40) 人間作 [4](40)
推敲前
(20)
推敲後
(20)
優秀
(20)
入賞
(20)
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
15
アンケート調査内容
質問 選択肢
Q1 題に基づいていると思いますか? 非常に
そう思う
やや
そう思う
どちらとも
言えない
あまりそう
思わない
全くそう
思わない
Q2 意味が通りますか? 通る 通らない
Q3 文法的に正しいですか? 正しい 正しくない
Q4 句節の繋がりがありますか? ある ない
Q5 句会で選を入れますか? 特選 並選 並選候補 予選 無選
Q1~Q4
80 句それぞれに対する絶対評価
Q5
異なる組み合わせの各 40 句の 4 つの俳句群に対する相対評価(下表)
予選句: 20~30 句
並選候補: 10~20 句
並選: 4~5 句
特選: 1~2 句
回答者
句歴 5~40 年の俳人 11 名
A 群 B 群 C 群 D 群
生成句 推敲後 推敲後 推敲前 推敲前
人間作 優秀 入賞 優秀 優秀
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
16
Q1~Q4 :題,意味,文法,句節の繋がり
質問 選択肢
Q1 題に基づいていると思いますか? 非常に
そう思う
やや
そう思う
どちらとも
言えない
あまりそう
思わない
全くそう
思わない
Q2 意味が通りますか? 通る 通らない
Q3 文法的に正しいですか? 正しい 正しくない
Q4 句節の繋がりがありますか? ある ない
Q5 句会で選を入れますか? 特選 並選 並選候補 予選 無選
推敲前後ともに,概ね肯定的な回答
Q1 Q2 Q4
Q3
肯定的
否定的
題に基づいた俳句の基本的な項目を満たす俳句を選択
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
17
Q5: 句会で選を入れるか
4 つの群全てについて、人間作の俳句群の方が多くの選を獲得
推敲前後の俳句ともに,全体として見ると
人間作の俳句には及ばない
A 群 B 群 C 群 D 群
生成句 推敲後 推敲後 推敲前 推敲前
人間作 優秀 入賞 優秀 優秀
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
18
Q5: 句会で選を入れるか
推敲前後の選の比較
推敲後のみ特選を得た例
切れ字→動詞,文語→口語,語句入替が適切
句意が変わっているが口語俳句として良い(俳人コメント)
推敲前のみ並選を得た例
最も強調している「夜寒かな」の変更により良さが失われている
並選 特選
推敲前のみ 2 1
推敲後のみ 3 0
両方 5 0
優秀句との相対評価 ( 句数 )
並選 特選
推敲前のみ 2 0
推敲後のみ 2 1
両方 7 1
入賞句との相対評価 ( 句数 )
推敲前 推敲後
冬椿淋しきまでに咲きにけり 冬椿咲いて淋しさつれている
推敲前 推敲後
鉄瓶の湯気ほとばしる夜寒かな 寒い夜鉄瓶の湯気ほとばしる
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
19
推敲に関するヒアリング調査
推敲後の俳句について
旧仮名遣い,切れ字,文語表現が含まれる俳句は無い
LLM が推敲すべき部分を正確に特定し,現代的な俳句へと推敲
文語→口語,切れ字→動詞の変換が適切でない例が多い
文語: 10 句中 3 句,切れ字: 12 句中 4 句
LLM の学習データに現代的な俳句が少ない可能性
語句の入替によりリズム感や定型感が損なわれることがある
12 句中 5 句
俳句のリズムや句切れを考慮した推敲が困難
• 現代的な俳句へと推敲されたことを確認
• 現代的な俳句への推敲事例・学習データの追加
と,リズム感を考慮した推敲が課題
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
20
実験②批評文生成手法の性能検証
目的
批評文生成手法が、俳句の長所や出来栄えを適切に評価する批評文を
生成できるかを検証
方法
文章生成対象の俳句を収集
異なる特徴を持つ俳句 15 句
ふくし句会に投句された俳句から主観により収集
提案手法を用いて各俳句に対して 1 文を生成
評価方法
アンケート調査用の以下の俳句を収集
生成した 15 文
俳人が作成した批評文 3 文
収集した文について俳人 11 名へアンケート調査
批評文として適切か
貰う批評文として嬉しいか
(生成文のみ) 15 文全体として表現に偏りがないか
モデル
OpenAI API gpt-4o-2024-11-20
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
21
アンケート調査結果
Q1, Q2 :生成文について,共に概ね肯定的な回答
俳句作成者に対して生成する批評文として適切
Q3 :「非常に偏りがある」「偏りがある」が約 55%
全体として表現や構成の一部に偏りがあることを確認
Q1 :俳句の長所や出来栄えを適切に批評している
か
Q2 :自分の作品に対して貰う批評文として嬉しい
か
生成文 俳人作の批評文
Q3 : 15 文全体として見たと
き
に表現に偏りがあるか
生成文
Q1 Q1
Q2 Q2 Q3
肯定的
否定的
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
22
15 文全体としての偏り
表現については偏りは見られない
要素の構成順序に一定の傾向
出来栄えを評価する適切な批評文として,作者に嬉
しさや喜びといった感情をもたらすことを確認
100 文の生成に必要な API の利用額は約 1,000 円
これまで参加してきた句会や大会の規模
(数 10~ 数 100 作品)であれば十分提供できる可能性
生成された批評文
特に肯定的な回答を受けた批評文の例
要素「特徴的な語句や表現」についての説明
「バタフライ」を取り上げ,その効果について適切に説明
俳句 特徴的な語句や表現の説明文
「バタフライ」という動的な行為の取
り合わせが、新たな挑戦のエネルギー
を感じさせます。
夜の秋初めて習うバタフライ
一部の要素をランダムに
構成することで修正可能
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
23
まとめ
LLM を用いた多数の生成句から題に基づいた俳句を選
択・推敲する手法の開発
俳人の推敲プロセスに基づく LLM による選択・推敲
選択された俳句の質の検証
題に基づく現代的な俳句を適切に選択
句切れやリズムを考慮した推敲が課題
俳句の長所や出来栄えを評価する批評文生成手法の開発
俳人作の批評文に基づく LLM による批評文の生成
生成文の内容・質の検証
LLM が俳句を分析し、各要素を適切に説明
句節の繋がりやリズム感を考慮した批評文生成が課題
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
24
研究業績
• 国際学会 口頭発表 査読あり( 1 件)
– ○Shunki Tomizawa, Soichiro Yokoyama, Tomohisa Yamashita, Hidenori
Kawamura : Proposal of a Haiku Evaluation Method Using Large Language Model
and Prompt Engineering, KICSS2024, 2024
• 国内学会 口頭発表 査読無し( 2 件) 発表予定( 1 件)
– ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 : 大規模言語モデルと Chain of
Thought Prompting を用いた俳句の評価 , 情報処理学会第 86 回全国大会 , 2024
– ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 : 大規模言語モデルを用いた
CoT Prompting による俳句の評価機構の提案 , 人工知能学会全国大会(第 38
回) , 2024
– ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 : LLM を用いた俳句の批評文生
成とその評価 , 第 71 回 EC 研究発表会 , 2025
• 国内学会 ポスター発表 査読無し( 1 件)
– ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 :ChatGPT を用いた俳句の選句
とその評価 , 情報処理北海道シンポジウム 2023
• 受賞( 3 件)
– 研究奨励賞(情報処理北海道シンポジウム 2023 )
– 学生奨励賞(情報処理学会第 86 回全国大会)
– Best Student Paper Award ( KICSS2024 )
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
25
AI 俳句に関する業績(一部抜粋)
句会・企画 時期 俳句 選・評価
ふくし句会
2023/06 洗ひたる硯の海の涼しさよ 特選 2 並選 3
2023/08 虫の声月夜を渡る風の声 並選 2
2023/09 神々の松茸飯の炊きあがる 特選 2
2023/11 冬ざれてねんねこの影あたたかし 並選 3
2024/04 山吹の黄を極めたる蕾かな 特選 1 並選 1
2024/06 初夏といふ光の中に立つごとし 特選 1 並選 1
2024/07 死に方を考えている夜の秋 特選 1 並選 4
2024/08 寸分の隙もなかりし大暑かな 特選 3
2024/10 人を待つ心の隙に冬隣 並選 3
芭蕉祭山中温泉
全国俳句大会
2021/10
戦争を語りつくしてトマト食む 入選
万緑を破りて風のなかにゐる 入選
俳句対局厳冬王
決定戦
2023/12
涼風の吹きぬけてゆくたのしさよ 俳人作を上回
る高評価
戦争があったのですか秋の風
• 複数の句会や大会で俳人作を上回る評価を獲得
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
26
本実験で推敲した俳句と批評文の例
冬の寒さを背景に咲く冬椿が、この俳句
の情緒を支える決定的な役割を果たしています。
冬の季節に咲くこの花の控えめな美しさが、孤
独や静寂のモチーフと深く結びついています。
その光景は、庭先や林の一角で鮮やかな
彩りを放ちながらも、周囲の冷たさを感じさせ
る状況が強く浮かび上がるものです。作者の心
には、咲く冬椿に投影された淋しさが寄り添い、
自然の情景と内面の感情の共鳴が繊細に表現さ
れています。
「淋しさをつれている」という表現には、一種
の擬人化的な魅力もあり、感情に形を与える力
が見事です。全体として、自然の美しさとそれ
が引き起こす人間の感情との微妙なバランスが、
この句に静謐な味わいを与えています。
冬椿咲いて淋しさつれて
いる
A
I
一
茶
Ad

More Related Content

More from harmonylab (20)

【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
harmonylab
 
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
 
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
harmonylab
 
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
harmonylab
 
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
 
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
 
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
 
【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
 
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
harmonylab
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
 
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
harmonylab
 
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
harmonylab
 
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
harmonylab
 
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
harmonylab
 
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
harmonylab
 
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
harmonylab
 
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
harmonylab
 
【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024【DLゼミ】Generative Image Dynamics, CVPR2024
【DLゼミ】Generative Image Dynamics, CVPR2024
harmonylab
 
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...From Pretraining Data to Language Models to Downstream Tasks:Tracking the Tr...
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
harmonylab
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
 

【修士論文】LLMを用いた俳句推敲と批評文生成に関する研究

  • 1. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. LLM を用いた俳句推敲と 批評文生成に関する研究 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士課程 2 年 冨澤 峻己
  • 2. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 2 研究背景 芸術分野において,人間は「選択」「推敲」「批評」 を通して作品の価値を発見・向上 「選は創作なり」(高浜虚子) 推敲を重ねた作品を相互に見せ合い,感性や技術を磨く 言語モデルによる俳句の生成 [1][2] 芸術分野の 1 つとしての研究 AI の感情理解や俳句の新たな表現の可能性を示唆 [1] Kikuchi, S., Kato, K., Saito, J., Okura, S., Murase, K., Yamamoto, T. and Naka- gawa, A.: Quality Estimation for Japanese Haiku Poems Using Neural Network, IEEE2016 (2016). [2] Jimpei Hitsuwari, Yoshiyuki Ueda, Woojin Yun, and Michio Nomura. Does human– AI collaboration lead to more creative art? Aesthetic evaluation of 人工知能技術を用いて芸術分野に取り組む上で、 生成作品を選択・推敲・批評することが重要 課題 生成句の推敲と選択 特徴を適切に解釈した俳句の批評
  • 3. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 3 俳句を相互評価する場「句会」 各々が指定された題に基づいて作成した俳句を持ち 寄り、相互評価を行う 題:兼題(季語)の指定、季節の俳句 相互評価:特選・並選などの選、批評 作句 作句 作句 選句 批評 俳句一覧 題 題に基づく俳句を複数作り, その中から提出する作品を決める 選を入れた俳句の長所や 出来栄え、感想などを述べる 良いと感じた他者の 俳句に選を入れる 句会の流れ
  • 4. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 4 俳句を相互評価する場「句会」 各々が指定された題に基づいて作成した俳句を持ち寄り、 相互評価を行う 題:兼題(季語)の指定、季節の俳句 相互評価:特選・並選などの選、批評 句会のプロセス 作句 作句 作句 選句 批評 俳句一覧 題 本研究のアプローチ 作句 批評 生成句からの題に基づく選択と推敲 長所や出来栄えを評価する批評文生成 [3] Kodai Hirata and Soichiro Yokoyama, Tomohisa Yamashita, and Hidenori Kawa- mura. Implementation of Autoregressive Language Models for Generation of Seasonal Fixed-form Haiku in Japanese. KICSS2022, 2022. • 言語モデルによる約 1 億句の生成句 [3] から選択・推 敲 • AI 俳句と題して本研究室で 2017 年から着手 生成句 DB GPT-2 選択・推敲 推敲俳句 既存研究 本研究 Web 上の 約 50 万句 学習 生成 取得 推敲 句会で選を得た生成句の例 洗ひたる硯の海の涼しさよ 山吹の黄を極めたる蕾かな 戦争を語りつくしてトマト食む 万緑を破りて風のなかにゐる
  • 5. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 5 研究目的 多数の生成句から題に基づいた俳句を選択・推敲する手 法の開発 GPT-2 による多数の生成句を活用 俳人の推敲プロセスに基づく LLM による選択・推敲 選択された俳句の質の検証 俳句の長所や出来栄えを評価する批評文生成手法の開発 俳人作の批評文に基づく LLM による批評文の生成 生成文の内容・質の検証
  • 6. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 6 俳句 日本の伝統文芸「俳句」 季語を 1 つ含み、 5-7-5 の 17 音で構成される定型詩 作者は目に映った情景を 17 音に込め、感情を示唆する 蛙が池に飛び込む音が聞こえてくるほど静かだ 鑑賞者は俳句に込められた情景や心情を読み解く 水音を一瞬に過ぎない人間の生涯に例え、その虚しさや大切さを 説いている 最も有名な俳句の 1 つ(松尾芭蕉, 1686 年) 古池や蛙飛び込む水の音 芭蕉 非常に難しい作業 俳句を介した情景や心情の共有
  • 7. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 7 データベース中の生成句と俳句の推敲 本研究で扱う生成句の課題 似通った古風な表現を含む俳句が多数 Web 上で収集した学習データに起因 現代句会において評価されづらい傾向 現代的な俳句への推敲例 寒鴉いつもの声で鳴きにけり 毎日を同じ声して寒鴉 春の雪ちぎれちぎれに降ちにけり 風鈴の音のしきりに鳴りにけり 満開の桜の下にかくれけり 現代的な俳句にする必要 方法 1 現代的な俳句を収集・学習させ,生成 方法 2 既存の生成句を現代的な俳句へ変換 学習データ不足により 不可能 少数の事例があれば LLM により可能 俳句の推敲 一度できた俳句をより目的にあった俳句に するために字句を吟味して練り直すこと 本研究では現代的な俳句にすることを目的と設定 古風な生成句の例
  • 8. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 8 俳句の推敲手法 俳人へのヒアリングにより現代的な俳句への推敲のた めに変更が必要な作業を決定 古風→現代的な俳句に関する作業 旧仮名遣い→新仮名遣い 切れ字→動詞,形容詞など他の表現 文語表現→口語表現 一般的に行う作業 語句の入替 句意の分析 LLM を用いた Few-shot CoT Prompting による俳句推敲 俳人の推敲プロセスに基づく 3 つの入出力例を設計 入力:選択対象の生成句 5 句,入出力例 出力:推敲後の俳句 項目 例 旧仮名遣い ゐる、しづか 切れ字 かな、けり 文語表現 消えたる、寂しき 俳 句 選 択 古 典 表 現 特 定 旧 仮 名 遣 い 変 更 句 意 分 析 切 れ 字 変 更 文 語 表 現 変 更 語 句 入 替 句 意 再 分 析 俳 句 推 敲 俳 句 Input Output
  • 9. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 9 俳句の推敲手法 俳人へのヒアリングにより現代的な俳句への推敲のために 変更が必要な作業を決定 古風→現代的な俳句に関する作業 旧仮名遣い→新仮名遣い 切れ字→動詞,形容詞など他の表現 文語表現→口語表現 一般的に行う作業 語句の入替 句意の分析 LLM を用いた Few-shot CoT Prompting による俳句の推敲 俳人の推敲プロセスに基づく入出力例を設計 入力:選択対象の生成句 5 句,入出力例 出力:推敲後の俳句 項目 例 旧仮名遣い ゐる、しづか 切れ字 かな、けり 文語表現 消えたる、寂しき 俳 句 選 択 古 典 表 現 特 定 旧 仮 名 遣 い 変 更 句 意 分 析 切 れ 字 変 更 文 語 表 現 変 更 語 句 入 替 句 意 再 分 析 俳 句 推 敲 俳 句 Input Output 推敲過程の例 冬の海恐ろしきまで澄みにけり 冬の海恐ろしきまで澄んでいる 冬の海恐ろしいまで澄んでいる 恐ろしいまで澄んでいる冬の海 切れ字変更 文語表現変更 語句入替
  • 10. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 10 俳句選択手法 俳句選択手法の概要 入力:題(文字列) 出力:推敲後の俳句 冬の句 情景生成 キーワード 生成 俳句取得 俳句選択 俳句 DB LLM Input Output LLM LLM 冬の海恐ろしきまで澄みにけり 題から想像される情景や 場面の説明文を 10 個生成 題と情景に基づく 単語を 10 個生成 各キーワードを含む 俳句を取得 選択対象の俳句を評価・推 敲し、段階的に俳句を選択 俳句推敲 LLM 恐ろしいまで澄んでいる冬の海 データベースから 選択した生成句 推敲後の俳句
  • 11. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 11 俳句の批評文 俳人が批評文を作成するには多大な労力が必要 俳句の本質や出来栄えを評価し,数百文字に言語化 数百句~数千句の応募がある公募企画において,一般的に上位数 % に のみ付与 最も字数の多い批評文に関しては上位 1% 未満 本来は句会・公募企画の全作品に対して作成することが理想 参加者の満足度・技術力向上,新しい視点・価値観の取得, etc. 本研究で扱う批評文 俳句 批評文 句会や公募企画で最優秀作品に対して俳人が作成 する,作品の長所や出来栄えを評価する文 こほろぎや診察長き妻を待つ 秋に鳴く虫のなかで最も身近なものの一つが蟋蟀 でしょう。初秋から鳴きはじめて、... ... 夫人を思いやり、不安になる作者の心情を思うと、 蟋蟀の鳴き声がいっそう哀切に聞こえてきました。
  • 12. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 12 生成する批評文の決定 俳人が最優秀句に対して作成した批評文を収集し, 「字数」「文調」「述べている要素」を分析 HAIKU 日本大賞 [4] ,白鳥庭園俳句大賞 [5] の計 32 文 要素 説明 1 特徴的な語句や表現 特徴的な語句や表現を指摘し、その効果や良さを説明 2 現実における具体例 俳句や一部語句から想像される現実で起こり得る事象を具体的に説明 3 季語の使い方 季語を取り上げ、季語そのものやその効果を説明 4 リズムと音 リズムや読み(音)に着目しリズム感の良さやバランスについて説明 5 意味の解釈 俳句の内容や作者が込めたであろう事象の解釈を説明 6 情景の解釈 俳句や一部語句から想像される情景や場面の解釈を説明 7 作者の心情の解釈 俳句や一部語句から想像される作者の心情の解釈を説明 8 全体としての感想 俳句全体から受ける印象や俳句を詠むことによって感じたことを説明 • 270~320 字,丁寧語,以下の 8 要素のうち 4~6 要素を 含む • 同一企画内での文頭,要素構成,言い回しなどの多様性 結果 [4] HAIKU 日本 , https://haikunippon.net/ (2025 年 1 月 27 日閲覧 ) [5] 白鳥庭園俳句大賞 , https://www.shirotori-garden.jp/haiku/ (2025 年 1 月 27 日閲覧 )
  • 13. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 13 批評文生成手法 LLM を用いた Few-Shot CoT Prompting による批評文生成 俳人作の批評文を利用した 3 つの入出例を設計 入力:俳句,入出力例,過去に生成した批評文と構成 出力:批評文章 語 句 分 析 過 去 文 の 構 成 分 析 要 素 選 択 強 調 要 素 選 択 要 素 構 成 決 定 過 去 文 の 表 現 分 析 批 評 文 生 成 Input Output 批 評 文 俳 句 群 俳 句 多様性の確保 • 4~6 個の要素選択 • 構成順序の決定
  • 14. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 14 実験①俳句選択手法の性能検証 目的 俳句選択手法により選択した推敲後の俳句の質を検証 推敲後の俳句が現代的な口語俳句に推敲されたかを検証 方法 題を「冬の句」として 20 句を選択 アンケート調査用の俳句を収集(右表) 評価方法 収集した俳句について俳人 11 名へのアンケート調査 題に基づいているか 俳句の基本的な項目を満たしているか 意味,文法,句節の繋がり 句会で選を得るか 生成句について俳人 3 名へのヒアリング調査 現代的な俳句へと推敲されているか モデル OpenAI API gpt-4o-2024-11-20 収集した俳句 ( 数 ) 生成句 (40) 人間作 [4](40) 推敲前 (20) 推敲後 (20) 優秀 (20) 入賞 (20)
  • 15. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 15 アンケート調査内容 質問 選択肢 Q1 題に基づいていると思いますか? 非常に そう思う やや そう思う どちらとも 言えない あまりそう 思わない 全くそう 思わない Q2 意味が通りますか? 通る 通らない Q3 文法的に正しいですか? 正しい 正しくない Q4 句節の繋がりがありますか? ある ない Q5 句会で選を入れますか? 特選 並選 並選候補 予選 無選 Q1~Q4 80 句それぞれに対する絶対評価 Q5 異なる組み合わせの各 40 句の 4 つの俳句群に対する相対評価(下表) 予選句: 20~30 句 並選候補: 10~20 句 並選: 4~5 句 特選: 1~2 句 回答者 句歴 5~40 年の俳人 11 名 A 群 B 群 C 群 D 群 生成句 推敲後 推敲後 推敲前 推敲前 人間作 優秀 入賞 優秀 優秀
  • 16. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 16 Q1~Q4 :題,意味,文法,句節の繋がり 質問 選択肢 Q1 題に基づいていると思いますか? 非常に そう思う やや そう思う どちらとも 言えない あまりそう 思わない 全くそう 思わない Q2 意味が通りますか? 通る 通らない Q3 文法的に正しいですか? 正しい 正しくない Q4 句節の繋がりがありますか? ある ない Q5 句会で選を入れますか? 特選 並選 並選候補 予選 無選 推敲前後ともに,概ね肯定的な回答 Q1 Q2 Q4 Q3 肯定的 否定的 題に基づいた俳句の基本的な項目を満たす俳句を選択
  • 17. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 17 Q5: 句会で選を入れるか 4 つの群全てについて、人間作の俳句群の方が多くの選を獲得 推敲前後の俳句ともに,全体として見ると 人間作の俳句には及ばない A 群 B 群 C 群 D 群 生成句 推敲後 推敲後 推敲前 推敲前 人間作 優秀 入賞 優秀 優秀
  • 18. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 18 Q5: 句会で選を入れるか 推敲前後の選の比較 推敲後のみ特選を得た例 切れ字→動詞,文語→口語,語句入替が適切 句意が変わっているが口語俳句として良い(俳人コメント) 推敲前のみ並選を得た例 最も強調している「夜寒かな」の変更により良さが失われている 並選 特選 推敲前のみ 2 1 推敲後のみ 3 0 両方 5 0 優秀句との相対評価 ( 句数 ) 並選 特選 推敲前のみ 2 0 推敲後のみ 2 1 両方 7 1 入賞句との相対評価 ( 句数 ) 推敲前 推敲後 冬椿淋しきまでに咲きにけり 冬椿咲いて淋しさつれている 推敲前 推敲後 鉄瓶の湯気ほとばしる夜寒かな 寒い夜鉄瓶の湯気ほとばしる
  • 19. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 19 推敲に関するヒアリング調査 推敲後の俳句について 旧仮名遣い,切れ字,文語表現が含まれる俳句は無い LLM が推敲すべき部分を正確に特定し,現代的な俳句へと推敲 文語→口語,切れ字→動詞の変換が適切でない例が多い 文語: 10 句中 3 句,切れ字: 12 句中 4 句 LLM の学習データに現代的な俳句が少ない可能性 語句の入替によりリズム感や定型感が損なわれることがある 12 句中 5 句 俳句のリズムや句切れを考慮した推敲が困難 • 現代的な俳句へと推敲されたことを確認 • 現代的な俳句への推敲事例・学習データの追加 と,リズム感を考慮した推敲が課題
  • 20. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 20 実験②批評文生成手法の性能検証 目的 批評文生成手法が、俳句の長所や出来栄えを適切に評価する批評文を 生成できるかを検証 方法 文章生成対象の俳句を収集 異なる特徴を持つ俳句 15 句 ふくし句会に投句された俳句から主観により収集 提案手法を用いて各俳句に対して 1 文を生成 評価方法 アンケート調査用の以下の俳句を収集 生成した 15 文 俳人が作成した批評文 3 文 収集した文について俳人 11 名へアンケート調査 批評文として適切か 貰う批評文として嬉しいか (生成文のみ) 15 文全体として表現に偏りがないか モデル OpenAI API gpt-4o-2024-11-20
  • 21. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 21 アンケート調査結果 Q1, Q2 :生成文について,共に概ね肯定的な回答 俳句作成者に対して生成する批評文として適切 Q3 :「非常に偏りがある」「偏りがある」が約 55% 全体として表現や構成の一部に偏りがあることを確認 Q1 :俳句の長所や出来栄えを適切に批評している か Q2 :自分の作品に対して貰う批評文として嬉しい か 生成文 俳人作の批評文 Q3 : 15 文全体として見たと き に表現に偏りがあるか 生成文 Q1 Q1 Q2 Q2 Q3 肯定的 否定的
  • 22. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 22 15 文全体としての偏り 表現については偏りは見られない 要素の構成順序に一定の傾向 出来栄えを評価する適切な批評文として,作者に嬉 しさや喜びといった感情をもたらすことを確認 100 文の生成に必要な API の利用額は約 1,000 円 これまで参加してきた句会や大会の規模 (数 10~ 数 100 作品)であれば十分提供できる可能性 生成された批評文 特に肯定的な回答を受けた批評文の例 要素「特徴的な語句や表現」についての説明 「バタフライ」を取り上げ,その効果について適切に説明 俳句 特徴的な語句や表現の説明文 「バタフライ」という動的な行為の取 り合わせが、新たな挑戦のエネルギー を感じさせます。 夜の秋初めて習うバタフライ 一部の要素をランダムに 構成することで修正可能
  • 23. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 23 まとめ LLM を用いた多数の生成句から題に基づいた俳句を選 択・推敲する手法の開発 俳人の推敲プロセスに基づく LLM による選択・推敲 選択された俳句の質の検証 題に基づく現代的な俳句を適切に選択 句切れやリズムを考慮した推敲が課題 俳句の長所や出来栄えを評価する批評文生成手法の開発 俳人作の批評文に基づく LLM による批評文の生成 生成文の内容・質の検証 LLM が俳句を分析し、各要素を適切に説明 句節の繋がりやリズム感を考慮した批評文生成が課題
  • 24. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 24 研究業績 • 国際学会 口頭発表 査読あり( 1 件) – ○Shunki Tomizawa, Soichiro Yokoyama, Tomohisa Yamashita, Hidenori Kawamura : Proposal of a Haiku Evaluation Method Using Large Language Model and Prompt Engineering, KICSS2024, 2024 • 国内学会 口頭発表 査読無し( 2 件) 発表予定( 1 件) – ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 : 大規模言語モデルと Chain of Thought Prompting を用いた俳句の評価 , 情報処理学会第 86 回全国大会 , 2024 – ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 : 大規模言語モデルを用いた CoT Prompting による俳句の評価機構の提案 , 人工知能学会全国大会(第 38 回) , 2024 – ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 : LLM を用いた俳句の批評文生 成とその評価 , 第 71 回 EC 研究発表会 , 2025 • 国内学会 ポスター発表 査読無し( 1 件) – ○ 冨澤 峻己 , 横山 想一郎 , 山下 倫央 , 川村 秀憲 :ChatGPT を用いた俳句の選句 とその評価 , 情報処理北海道シンポジウム 2023 • 受賞( 3 件) – 研究奨励賞(情報処理北海道シンポジウム 2023 ) – 学生奨励賞(情報処理学会第 86 回全国大会) – Best Student Paper Award ( KICSS2024 )
  • 25. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 25 AI 俳句に関する業績(一部抜粋) 句会・企画 時期 俳句 選・評価 ふくし句会 2023/06 洗ひたる硯の海の涼しさよ 特選 2 並選 3 2023/08 虫の声月夜を渡る風の声 並選 2 2023/09 神々の松茸飯の炊きあがる 特選 2 2023/11 冬ざれてねんねこの影あたたかし 並選 3 2024/04 山吹の黄を極めたる蕾かな 特選 1 並選 1 2024/06 初夏といふ光の中に立つごとし 特選 1 並選 1 2024/07 死に方を考えている夜の秋 特選 1 並選 4 2024/08 寸分の隙もなかりし大暑かな 特選 3 2024/10 人を待つ心の隙に冬隣 並選 3 芭蕉祭山中温泉 全国俳句大会 2021/10 戦争を語りつくしてトマト食む 入選 万緑を破りて風のなかにゐる 入選 俳句対局厳冬王 決定戦 2023/12 涼風の吹きぬけてゆくたのしさよ 俳人作を上回 る高評価 戦争があったのですか秋の風 • 複数の句会や大会で俳人作を上回る評価を獲得
  • 26. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 26 本実験で推敲した俳句と批評文の例 冬の寒さを背景に咲く冬椿が、この俳句 の情緒を支える決定的な役割を果たしています。 冬の季節に咲くこの花の控えめな美しさが、孤 独や静寂のモチーフと深く結びついています。 その光景は、庭先や林の一角で鮮やかな 彩りを放ちながらも、周囲の冷たさを感じさせ る状況が強く浮かび上がるものです。作者の心 には、咲く冬椿に投影された淋しさが寄り添い、 自然の情景と内面の感情の共鳴が繊細に表現さ れています。 「淋しさをつれている」という表現には、一種 の擬人化的な魅力もあり、感情に形を与える力 が見事です。全体として、自然の美しさとそれ が引き起こす人間の感情との微妙なバランスが、 この句に静謐な味わいを与えています。 冬椿咲いて淋しさつれて いる A I 一 茶

Editor's Notes

  • #1: LLMを用いた俳句推敲と批評文生成に関する研究と題して,発表します.
  • #2: まず,研究背景についてです. 芸術分野において、人間は作品の「選択」「推敲」「批評」を通して作品の価値を発見し、感性や技術を向上させてきました。 そのため,人工知能技術を用いて芸術分野に取り組むうえで,生成作品を「選択」「推敲」「批評」することは重要な作業となります. 芸術分野の1つである俳句は,文字数の短さに対する情報量の多さからAIの感情理解や俳句の新たな表現の可能性に繋がると考えられ,俳句の生成に関する研究が為されています. しかし,生成句の推敲・選択や批評はいまだに十分な研究が行われていません. 虚子は後に「選は創作なり」と述べている。 数多くの句の中から何を選び、どこに着目し、どのように評価するのかは、選ぶ側の審美眼にかかるのであり、立派な創作行為なのだと虚子は言う。
  • #3: 俳句の世界では,俳人たちが自身の作品を句会という場に持ち寄り,相互評価を行う文化があります. 句会では,まず俳人各々が指定された題に基づく俳句の作成を行います. このとき,一般的には複数の作品候補を作り,一句または数句選んで提出します. その後,提出作品の中から他者のよいと感じた作品に特選,並選などの選をいれ,最後に,各々が選を入れた俳句に対する批評を述べます.
  • #4: 本研究では,句会のプロセスにおける作句にあたる部分を,本研究室でこれまでに生成してきた約1億句の生成句からの選択・推敲と位置づけ,批評にあたる部分を長所や出来栄えを評価する批評文の生成と位置付けます. スライド左の表に,俳人から高評価を受けた生成句の例を示しています. 生成句は,web上で収集した約50万句を学習したGPT-2により生成した俳句で,句会や大会で選を得る質の俳句も中には含まれているものとなっています.
  • #5: 研究目的についてです. まず,多数の生成句から題に基づいた俳句を選択・推敲する手法の開発を行います. GPT-2による生成句を利用し,俳人の推敲プロセスに基づいたLLMによる選択・推敲の実装を行い,選択された俳句の質の検証します. 2点目として,俳句の長所や出来栄えを評価する批評文生成手法の開発を行います. 俳人作の批評文に基づくLLMによる批評文の生成を行い,生成文の内容・質の検証をします.
  • #6: 初めに,俳句について説明します. 俳句は日本の伝統文芸で,季語と呼ばれる季節の言葉を1つ含み,5-7-5の音数で構成される定型詩です. 最も有名な俳句の1つとしては,松尾芭蕉の「古池や蛙飛び込む水の音」という句があります. 俳句は,情景や心情を共有するという機能を持ちます. 作者は目に映った情景を17音に込め、感情を示唆する一方で,鑑賞者は俳句に込められた情景や心情を読み解きます. この例で言うと,蛙が池に飛び込む音が聞こえてくるほど静かだ,という俳句の解釈に基づいて,水音を一瞬に過ぎない人間の生涯に例え、その虚しさや大切さを説いている,と一般的には言われています. このように有名な俳句であれば共通の解釈が存在することがありますが,一般的に俳句に込められた事象の解釈は難しく,俳人によって異なる解釈が存在することも多くあります.
  • #7: 次に,本研究で扱う生成句について説明します. 本研究で扱う約1億句の生成句の中には,句会で選を得る質の俳句も含まれますが,一方で,これらの大半が,似通った古風な表現を含む,という課題があります. これはweb上で収集した学習データの古風さに起因しますが.このような古風な俳句は,現代の句会や大会では評価されづらい傾向があるため,現代的な俳句にする必要があります. 方法としてはまず,現代的な俳句を収集・学習させ,新たに生成するということが考えられますが,これは,収集可能な現代的な俳句が不足しているため難しいです. 一方で,既存の生成句を現代的な俳句へと変換することは,そのような変換の事例が複数あれば,LLMにより実現できる可能性があります. また,このような変換作業は俳句においては推敲として,実際に俳人が行っている作業となります. そこで,本研究では,この変換を俳人が作句の際に行う推敲の作業と位置付け,生成句を現代的な俳句へと推敲します.
  • #8: LMによる推敲を行うために,まず俳人へのヒアリングにより,推敲を行うために必要な作業を決定しました. 今回扱う現代的な俳句への推敲に関しては,旧仮名遣い,切れ字,文語表現の変更があり,その他一般的な推敲の作業として,語句の入替,句意の分析があります. 決定した作業項目と俳人が行っている推敲プロセスに基づいて,LLMによる推敲のプロセスを決定し,理想的な入出力例を含むプロンプトを設計しました. 入力は複数の俳句と入出力例で,出力は推敲された俳句です.
  • #9: 推敲過程の一例を示します. この例は,まず切れ字を含む「澄みにけり」を口語表現「澄んでいる」に変更した後,文語表現である「恐ろしき」の「き」を「い」に変え,最後に上五と,中七下五の語句の入替を行っています.
  • #10: 推敲機能を含む俳句選択手法の概要を示します. この手法は,題を入力とし,生成句データベースから取得した生成句に対して題に基づいた俳句の選択を段階的に行い,推敲した俳句を出力します. 詳細については時間の都合上割愛します.
  • #11: 次に,俳句の批評文についてです. 本研究では,句会や公募企画で最優秀作品に対して俳人が作成する,作品の長所や出来栄えを評価する批評文を扱います. この批評文を俳人が作成するには多大な労力がかり,実際,数百から数千の応募がある公募企画などでは,上位数%しか批評文は作成されず,さらに本研究で扱う最も字数の多い批評文に関しては上位1%未満となることが一般的です. しかし,本来は参加者の満足度や技術力向上といった観点から全作品に対して作成することが理想的であるため.このような批評文を自動で生成する手法を検討しました.
  • #12: まず,俳人が作成した批評文を収集し,字数,文調,批評文の中で述べている要素を分析しました. 結果として,字数は270字~320字,文調は丁寧語,そして,下の表の8個の要素のうち4~6個の要素を含むということを確認しました. 要素については,特徴的な語句や表現,俳句のリズムと音などがあり,俳人から見ても妥当な要素であることを確認しています. また,同一企画内での文頭の表現や要素の構成,言い回しなどに多様性があることを確認しました.
  • #13: 批評文生成手法について説明します. まず,先ほどの分析結果に基づいて,要素の選択・構成の決定を含む批評文生成プロセスを決定しました. また,多様性の確保のため,先に生成した批評文やその構成を次の入力に含め,2つの分析ステップで過去とは異なる構成や言い回しを決定するよう設計しました. そして,このプロセスに基づく理想的な入出力ペアを3つ設計しました. 入力は俳句,3つの入出力例,過去に生成した批評文とその構成で,出力は批評文章です.
  • #14: 実験1について説明します. 俳句選択手法により選択した推敲後の俳句の質を検証することと,推敲後の俳句が現代的な口語俳句に推敲されたかを検証することを目的として,実験を行います. 方法としては,まず,題を「冬の句」と設定し,提案手法により20句の俳句を選択しました. そして,アンケート調査用の俳句として,選択した俳句の推敲前の俳句と,題が「冬の句」の俳句募集企画で選を得た,優秀作品,入賞作品の2種類のレベル別の俳句をそれぞれ20句ずつ収集しました. 収集した俳句について,題に基づいているか,俳句の基本的な項目を満たしているか,句会で選を得るか,という3つの観点でアンケート調査を行った他,現代的な俳句へと推敲されているかについて俳人3名へのヒアリングを行いました.
  • #15: アンケート内容について説明します. 質問1~質問4は各俳句ごとの絶対評価です. 質問5「句会で選を入れるか」については,下の表に示す,生成句と人間作の異なる組み合わせの各40句の4つの俳句群それぞれに対する相対評価です. 選の種類に関する各選択肢の句数の目安は,実際の句会に基づいて設定しました. 回答者は句歴5~40年の俳人11名です.
  • #16: アンケート調査結果について説明します. 質問1~4については,推敲前後の俳句ともに概ね肯定的な回答を得たことから,提案手法により,題に基づいた,俳句の基本的な項目を満たす俳句が選択されたことが示されました.
  • #17: 質問5の「句会の選」については,4つの群全てにおいて人間作の俳句群の方が多くの選を獲得するという結果になりました. この結果より,推敲前後の俳句ともに,全体として見ると人間作の俳句には及ばないということが示されました.
  • #18: 一方で,選を得た生成句も複数存在しました. 推敲後のみ特選を得た例としては,「冬椿咲いて淋しさつれている」という句があり,俳人によると,推敲によって句意が変わっているが口語俳句として良いとのことで,推敲の作業も適切に行われていました. 一方で,推敲前のみ選を得た俳句もあり,「寒い夜鉄瓶の湯気ほとばしる」という句は,元の俳句で強調されていた「夜寒かな」という語句を変更してしまったために良さが失われているということが俳人へのヒアリングによりわかりました.
  • #19: 最後に,推敲後の俳句について,俳人へヒアリングを行いました. まず,推敲後の俳句20句の中に,旧仮名遣い,切れ字,文語表現を含む俳句は無いことがわかりました. この結果より,LLMが推敲すべき部分を正確に特定し,現代的な俳句へと推敲しているということが明らかになりました. 一方で,現代的な俳句への推敲の仕方については,文語表現や切れ字の変更の仕方が適切でない例がそれぞれ複数あることがわかりました. これは,LLMの学習データに口語俳句が極端に少ないことが原因として考えられます. また,語句の入替によりリズム感が損なわれる例も多くあることがわかりました. 結果として,現代的な俳句への推敲へと推敲されたことを確認しましたが,口語表現への推敲事例や学習データの追加と,句切れ,リズム感を考慮した推敲が課題であることが明らかになりました.
  • #20: 次に,実験2について説明します. 批評文生成手法が、俳句の長所や出来栄えを適切に評価する批評文を生成できるかを検証することを目的とします. 方法としては,ふくし句会という句会に投句された俳句の中から,主観評価により異なる特徴を持つ俳句15句を収集し,それらの俳句を対象に,各1文ずつ批評文を生成しました. 評価方法としては,生成した15文と俳人作の批評文3文を用いて,俳人11名へ,批評文として適切か,貰う批評文として嬉しいか,15文全体として表現に偏りがないか,という項目についてアンケート調査を行いました.
  • #21: 結果についてです. 質問1「長所や出来栄えを適切に批評しているか」,と,質問2「自分の作品に対して貰う批評文として嬉しいか」,については,俳人作の批評文には若干劣るものの,概ね肯定的な回答を得ました. この結果より,俳句作成者に対して生成する批評文として適切であることが示されました. 一方,質問3「15文全体としてみたときに偏りがあるか」については,「非常に偏りがある」「偏りがある」という回答約55%でした. この結果より,全体として表現や構成の一部に偏りがあることを確認しました.
  • #22: 生成された批評文について,肯定的な回答を得た批評文の1つとして,「夜の秋初めて習うバタフライ」という俳句に対する批評文の一部を示します. この文は,特徴的な語句である「バタフライ」について説明しており,俳句の意味を解釈したうえで,「新たな挑戦のエネルギーを感じさせる」,と,語句の効果を適切に述べているといえます. 一方で,否定的な回答が多くみられた15文全体としての表現や構成の偏りについてですが,俳人のコメントによると,表現についての偏りは見られず,要素の構成順序に一定の傾向があるということがわかりました. これは,一部の要素をランダムに構成することで修正可能であると考えます. 最後に,出来栄えを評価する適切な批評文として,作者に,嬉しさや喜びといった感情をもたらすことを確認した,という点について,本手法の生成コストは100文あたり約1,000円であるため,これまで参加してきた句会や大会の規模であれば十分提供できる可能性があると考えられます.
  • #23: まとめです. まず,俳人の推敲プロセスに基づく,LLMを用いた多数の生成句から題に基づいた俳句を選択・推敲する手法の開発を行いました. 実験の結果,題に基づく俳句を適切に選択し,現代的な俳句へと推敲した一方で,句切れやリズムを考慮した推敲が課題であることがわかりました. また,俳人作の批評文に基づく,俳句の長所や出来栄えを評価する批評文生成手法の開発を行いました. 実験の結果,LLMが俳句を分析し、各要素を適切に説明した一方で,句節の繋がりやリズム感を考慮した批評文の生成が課題であることがわかりました.
  • #24: 研究業績は以上のとおりです.
  • #25: このスライドは,AI俳句と題している本研究の,生成句に関する業績の一部を示しています. これまでに複数の句会や大会で,人間作を上回る評価を得た事例があります. ふくし句会は,本研究にご協力いただいている有限会社マルコボ.コムが主催している月に一度開催される句会で,私も参加しているのですが,私自身が自分で0から作成した俳句は滅多に選を得ない中,生成句の中から自分で,または提案手法により選択した生成句は,多くの選を得てきました.
  • #26: 最後に,このスライドでは,本研究で高評価を得た推敲後の俳句と,その俳句に対して批評文生成手法により生成した批評文を示しています. 以上で発表を終わります.