ある特定のトピック・内容に関するクエリ (質問)とそれに対する要約の組を複数提示し、可読性と情報性を両立した要約を目指します。
クエリと要約の生成には、主にSegEnc(Segment Encoder)という、Fusion-in-Decoderのアーキテクチャを取り入れた先行研究のモデルを利用します。
ある1つの文書から多様な内容のクエリを提示するための工夫として、文書全体を均等に分割して入力し、クエリを個別に生成する手法を提案します。
文書のより重要な内容をカバーするクエリと要約を生成するのための工夫として、文書の重要でない部分を事前に予測して除去する仕組みを導入します。
本研究では、マルチドメインの議事録を対象にした、クエリ指向要約向けの英語データセットであるQMSumを使用しています。
本研究は、2023年3月に開催される言語処理学会第29回年次大会に投稿・発表します。投稿した論文はこちらからご覧いただけます。