u++の備忘録

【論文メモ】会話によるニュース記事伝達のための間の調整

会話によるニュース記事伝達のための間の調整

どんなもの?

  • 会話によるニュース記事伝達において,割り込みを許容しながら快適なリズムで会話を進行させるための間の調整について検討
    • ユーザーが理解しやすく,発話中でも割り込みやすい間の実現を目指す

先行研究と比べてどこがすごい?

システム発話の工夫によって相互行為を活性化させようとする観点では,聞き手からの相槌やうなずきなどを誘発する研究が行われているが,これも韻律制御に留まっており,間の制御までは扱っていない [3]

技術や手法のキモはどこ?

  • コーパスの作成
    • テクノロジー系のニュース記事 100 個を人手で要約・口語化し,発話のシナリオを作成した.このシナリオを女性声優に発話させ,その発話音声を収録した
  • 発話内文節間の間の推定
    • 双方向 LSTMで学習
  • 発話間の間の推定
    • BayesianRidgeモデル

f:id:upura:20180506133233p:plain
f:id:upura:20180506133422p:plain
f:id:upura:20180506133605p:plain

どうやって有効だと検証した?

  • 音声合成器として AITalk(話者:のぞみ)を使用し,間の調整を行ったときと行わなかったときでどちらが「質問しやすかったか」「相槌を打ちやすかったか」「頭に入りやすかったか」について評価を行った
  • どちらについても調整を行った間の方が良いという結果が得られた

議論はある?

  • 個人ごとの間の調整や多重タスク下での間の取り方について検討
  • 抑揚の付け方や話速といった韻律情報を総合的に制御できる仕組みについても検討

次に読むべき論文は?

NULL