言語処理学会第22回年次大会に参加してきた.所感をいくらか書き留めておきたい.
ポスター
研究室の学生4名がポスターで発表したので,横に付き添って説明の補助をしていた.4名分のポスターに付き合ったので,木曜日の晩にはさすがに疲れ果てていた.あんなに疲れたことはないというくらい疲れていた.来年はあまり真面目に付き添うのは止めようと思う.
聴講
生成・要約セッションの座長をした.
日本語文生成器Haoriにおける複文合成(緒方健人, 佐藤理史, 松崎拓也 (名大))
実に渋い研究で,生成をやっていないとこのありがたさはなかなかわからないと思われるが,機械に複文を作らせるというもの.やってみるとわかるのだが,機械に複文を作らせるのはかなり難しい.単文を接続する構造の多様性およびその構造の網羅的な列挙が簡単ではないことが原因だが,それを列挙し実装したというもの.例の,星新一風のショート・ショートを機械に書かせる計画の1つのアウトプットということになるのだと思うが,こういった手堅い成果物こそ評価すべきなのではないかと思う.
要約長,文長,文数制約付きニュース記事要約(田中駿, 笹野遼平, 高村大也, 奥村学 (東工大))
自動要約システムの基本的な枠組みとして, Multi-Candidate Reduction (pdf) というものがある.文短縮などで元の文の亜種をあらかじめ大量に生成しておき,あとでうまく選択してやるというもので,生成における overgenerate-and-ranking (pdf) と同様の考え方になる.この研究では文短縮だけではなく文融合 (pdf) も文の亜種を生成する際に利用しており,自動要約研究として正しい方向に進んだものと思われた.大量に収集可能な livedoor news の要約を評価に利用している点もよい.ただし,参照要約とほとんど同等のものがどの程度できたか,という評価が必要だと思われた.
圧縮型要約のオラクルに関する考察(平尾努, 西野正彬, 永田昌明 (NTT))
これはもう,さすが,という他ない.機械翻訳において,ある特定のモデルが出力可能な翻訳のうち,ある尺度において最良の翻訳をオラクルという言い方をする (pdf) が,自動要約においてもオラクル要約というものを考えることができる.この研究は文短縮を行った場合のオラクル要約を議論するもので,その結論は示唆に富んでいる.印象深い結論は,
- 文抽出だけでかなり高い ROUGE スコアが達成できる
- 文短縮まで行うと ROUGE スコア上は参照要約に極めて近いものが生成できる
- 重要文抽出が未解決
- 文短縮のような比較的単純な生成でも大抵の場合十分
チュートリアル
今回はチュートリアルの担当だったので,チュートリアルにお呼びする方を決める必要があった.チュートリアル担当は年次大会のプログラム委員の仕事の中でも,プログラムに積極的に介入できる数少ない仕事であるように思われる.
ワークショップ
ワークショップを開催してみた.自由が丘のビア・バーで徳永先生と岩倉さんと飲み,そのあと更に武蔵小杉のスナックで岩倉さんと飲んでワークショップの基本的な方針が決まった.どうも,重要なことは飲み屋で決まることが多いように思う.2014年,2015年もワークショップに関わったので,3年連続になる.音頭を取る立場は初めてだったが,意外とさほど苦労しなかった.素晴らしい発表を多数頂戴でき,大変な盛況であったと言えるのではないか.今回,遠隔での発表を試みたが,ワーク・ライフ・バランスのセッションの中でこれができたことは価値があることだと思っている.
世界一の日本語の自然言語処理とは? (永田昌明 (NTT))
全てのご発表が興味深いものだったが,特に印象に残ったのは永田さんのこのご発表で,なかなか(もちろんよい意味で)過激な内容を含んでいた.私自身はかなり応用を意識する研究者だと思うので,立場としては永田さんにかなり近い.
宴会
今年も会期中,毎晩宴会だった.昨年さすがに飲みすぎたと反省したので,今年は少し抑えたが,来年は更に抑えたい.体力がずいぶん落ちている.ワークショップ後の懇親会で行ったせり鍋の店は素晴らしかった.
来年は筑波大学にて開催とのこと.