[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
SlideShare a Scribd company logo
ロボットに活用できる言語学の勉強会
2017/08/09
© 1→10Robotics, Inc. All rights reserved.
※はじめに
このスライドは、ワントゥーテンロボティクス社で 2017年8月9日に
開催された社内勉強会の内容を、一部再構成して公開したものです。
講演者は、社に所属する言語学を専攻してきたスタッフですが、
本人の希望により名前は伏せていますので、予めご了承ください。
2
© 1→10Robotics, Inc. All rights reserved.
アジェンダ
●言語学ってなに?
○ ざっくり言語学でやっていること
○ 言語学の中の研究分野
●ロボットとの会話体験に関連しそうなトピック紹介
○ グライスの「会話の格率」
○ フォリナートーク
○ フィラーの機能
3
© 1→10Robotics, Inc. All rights reserved.
言語学ってなに?
4
© 1→10Robotics, Inc. All rights reserved.
言語学ってなに?
言語の姿や仕組みについて考える学問
5
日本語 英語 スペイン語 中国語
アイヌ語 サンスクリット語 津軽方言
京都方言 日本手話 etc.
扱う「言語」
C++ Java Ruby etc.
ふつう扱わない「言語」
→人間の話す自然言語/方言を扱う。 →人工的な命令の体系は扱わない。
© 1→10Robotics, Inc. All rights reserved.
言語学ってなに?
m a k k u r o k u r o s u k e d e t e o i d e d e n a i t o m e d a m a o h o j i k u r u z o
6
makkuro kurosuke dete oide. denai to medama o hojikuru zo.
まっくろ くろすけ、 出て おいで。 出ない と 目玉 を ほじくる ぞ。
単語ごとに区切ったり文として理解するのには、頭の中の辞書と文法書が必要
→これの内容を明らかにしたい
言語の姿や仕組みについて考える学問
© 1→10Robotics, Inc. All rights reserved.
言語学で扱うこと
●いわゆる文法や意味:
○ 日本語の「た」には完了の意味があるのか?
○ 「悲しみ」や「楽しみ」はOKで「ヤバみ」「つらみ」はNGなのはなぜ?
●消えかけている言語や文法を書き留める
○ アイヌ語、沖縄の宮古方言など
●人間がことばを話す仕組み
○ 発音のしかた、文のつくりかた、子どもがことばを覚える仕組み など
●ことばの変化
○ 日本語の歴史的な変化、若者ことばの広がり方、いろいろな言語の祖先 など
※言語学の成果と関連はあるが、言語学そのものの対象ではないこと:
TOEICのスコアの上げ方(語学のノウハウ)、正しい日本語のありかた
7
© 1→10Robotics, Inc. All rights reserved.
言語学の目標
8
世界の言語の、
網羅的で詳しい
カタログを作る
=記述
人間がことばを話す
仕組みを解明する
=説明
● 生態や系統が載っている動物の図鑑のような感じで、世界
中の言語を記述・保存する
● 人間の言語のバリエーションと普遍性を探す
● 誰もが自然にことばを話せるようになるのに、
脳のどこがどう働いて、どのように文を理解したり
組み立てたり意味を操作したりするのかはわからない
© 1→10Robotics, Inc. All rights reserved.
ちなみに:世界の言語にまつわる数字
●ネイティブスピーカーの多い言語(Wikipedia)
9
1 中国語 13億7000万人
2 英語 5億3000万人
3 ヒンディー語 4億9000万人
4 スペイン語 4億2000万人
5 アラビア語 2億3000万人
6 ベンガル語 2億2000万人
7 ポルトガル語 2億1500万人
8 ロシア語 1億8000万人
9 日本語 1億3400万人
10 ドイツ語 1億3000万人
© 1→10Robotics, Inc. All rights reserved.
ちなみに:世界の言語にまつわる数字
10
6000+
世界の言語の数
6000とも7000とも言われます
2500
消滅の危機にある言語の数
ユネスコ、2009年
25
1年間に死ぬ言語の数
正確な統計はないもののペースとしては
こんな感じと言われます
世界にはたくさんの言語がありますが、けっこうなペースで消滅しています
© 1→10Robotics, Inc. All rights reserved.
ちなみに:言語学の規模感にまつわる数字
11
194
日本で「言語学を学べる」
大学の数
リクルート「スタディサプリ進路」
日本の大学:777校
経済学:346校 情報工学:203校
獣医学:16校
2000+
日本言語学会の会員数
日本言語学会
10,000-?
日本で言語学を学ぶ学生
1大学あたり学生50名としたときの
推計(正確なところは不明)
職業に直結しない小さな業界です(学問の立ち位置としては哲学とかに似ていると思います)
© 1→10Robotics, Inc. All rights reserved.
ちなみに:言語学の関連分野
12
言語学
文化
人類学
宗教学
歴史学
考古学
文学教育学
語学
社会学
心理学
哲学
論理学
工学
生物学
医学
自然
人類学
研究の素材を
相互に提供しあう
同じ題材の
異なる側面に/異なる方法で
アプローチする
方法論の共有/関連
だいたいの大学の中での立ち位置は「文学部の中のイケてない学科」なのですが、いろいろな分野と関連があります。
© 1→10Robotics, Inc. All rights reserved.
言語学の中の分野の紹介
&ロボットに関連しそうな分野
13
© 1→10Robotics, Inc. All rights reserved.
おとうさん わかんない
N n
えほんに おてんき
ɲ ŋ
お父さん、ここに何かいるよ。
リスかい?
わかんない。
ゴキブリでもない、ネズミでもない、黒いのがいっぱいいたの。
ふん。
どう?
まっくろくろすけ?絵本に出てた?
そうさ。こんないいお天気にお化けなんか出るわけないよ。
明るいところから急に暗いところに入ると、
目がくらんで「まっくろくろすけ」が出るのさ。
そうか。まっくろくろすけ、出ておいでーっ。
出ないと目玉をほじくるぞー。
言語学の中の研究分野:扱う単位による分類
14
音のレベル
(音声学、音韻論)
出る わけ ない
出て おいで
出 ないと
語(形態素)のレベル
(形態論)
これは、まっくろくろすけだな。 文のレベル
(統語論)
談話のレベル
(語用論(談話分析))
© 1→10Robotics, Inc. All rights reserved.
談話分析ってなに?
●談話:会話、手紙、スピーチ、文章など、文脈をもったことばのまとまり。
文より大きい単位。
●語用論の中で、実際の会話の記録など生のことばを分析して、談話の機能・構造・
運用を明らかにしようとする分野・手法が、「談話分析」。
※とくに文法の研究の場合、言語学者が頭の中で考えた例文を対象に分析するのが主流。
談話分析で扱う「実際に使われたことば(言語の運用)」は研究対象として軽視される傾向にあった。
●言語教育の現場/教材に応用されている。
社会学では同じような分野を「会話分析」と呼ぶ。
●たとえばこんなテーマ:
○ 話を切り出すときに使う「あのー」と「なんか」の機能の違い
○ 「勧誘」の場面での話の運び方の類型
15
© 1→10Robotics, Inc. All rights reserved.
談話分析ってなに?
●たとえばこんなデータを分析します
○ 実際の会話やロールプレイを録音(録画)したものや生放送のテレビ番組などの音声を
テキストに起こしたもの
○ 小説や雑誌記事、映画のスクリプト、手紙、スピーチなど
16
© 1→10Robotics, Inc. All rights reserved.
突然ですが、この文の意味は?
ここにはサメがいます。
17
© 1→10Robotics, Inc. All rights reserved.
当然、
ここにはサメがいます。
18
「ここ」という場所に「サメ」という生き物が存在している。
© 1→10Robotics, Inc. All rights reserved.
ただ、
19
ここには
サメがいます。
ここには
サメがいます。
→文の意味は文脈によって変わる。
(そして、実際に使われる言葉はすべて何らかの文脈の中にある。)
(サメを見ていってくださいね。) (危ないから遊泳禁止!)
© 1→10Robotics, Inc. All rights reserved.
言語学の中の研究分野:ことばの意味を考える
文それ自体の意味
(命題内容の真偽)を研究する
=意味論
20
ここには
サメがいます。
文脈の中での
文の意味やはたらきを研究する
=語用論
© 1→10Robotics, Inc. All rights reserved.
語用論とは
●ことばの実際の使われかた、
文脈や状況の中での 文の意味・はたらきを考える分野
例) 「この部屋は暑いですね。」
→「窓を開けてくれ」(間接発話行為)
「きょうは買い物に行かなくちゃ。」「午後から雨らしいよ。」
→「午前中に行ったほうがいいよ。」
「行ってきまーす。」「午後から雨らしいよ。」
→「傘を持って行きなさい。」
21
© 1→10Robotics, Inc. All rights reserved.
ロボットとの会話に関連しそうな分野
● 文より大きな単位「談話」、とくに
「会話」の組み立て方のルール、しくみ
● ターンテイキング、会話の始めかた/
終わらせかた、あいづち、言い直し、
割り込み、発話のオーバーラップなどなど
22
②会話分析(談話分析)
● ことばの実際の使われかた、文脈や状況の中で
の文の意味やはたらき
● 協調の原理、会話の格率、含意と推論、ポライト
ネスなどなど
①語用論
以下の2分野が特に関連しそうなので、以後、このあたりの話を中心に紹介します。
※会話分析は語用論の下位分野ですが、わかりやすいように分けて書いています。
© 1→10Robotics, Inc. All rights reserved.
ちなみに:生成文法と統語論について
23
自然言語処理をやる方には以下のような樹形図(ツリー)がおなじみかもしれません。
引用: http://sucra.saitama-u.ac.jp/modules/xoonips/download.php/KK000194-
4.pdf?file_id=834
● これは、統語論(syntax)を主に扱う
「生成文法 generative grammar」で文の構造を表
す図
● 生成文法は、言語の中の文法現象を規則の束と
して記述することで、人間の生得的な言語能力を
説明しようとする流派
● ノーム・チョムスキーが1950年代に創始し、20世
紀言語学の革命に。統語構造の研究が爆発的に
進歩した
● 「文そのものの理解」には大事な理論
もしも需要があれば、どこかでまとめます。軽く概観するならこのあたりをご覧ください
→はじめての生成文法・前編 / はじめての生成文法・後編
© 1→10Robotics, Inc. All rights reserved.
まとめ:言語学ってなに?/言語学の分野
●いろいろな自然言語の姿や仕組みについて考える学問。
●扱う対象によって研究分野が分かれる。
○ 扱うことばの単位で分けた分野(音/語/文/談話)
○ 意味を扱う「意味論」、文脈の中の意味を扱う「語用論」
○ ほかにも、問題意識や切り口/アプローチによる分類(歴史言語学、社会言語学、進化言語学、対
照言語学、記述言語学、言語類型論・・・)もあります。
●ロボットに関連しそうなのは「語用論」と「会話分析(談話分析)」。
24
© 1→10Robotics, Inc. All rights reserved.
詳しくは
● 斎藤純男『言語学入門』2010年、三省堂 http://amzn.asia/etqUGRM
学術的な入門書なのに読みやすくてそこそこ詳しい本。紙がいい。
● 風間喜代三ほか『言語学 第2版』2004年、東京大学出版会 http://www.utp.or.jp/book/b303099.html
大学の「概論」の授業で使う定番の入門書。わかりやすくて網羅的。
● 佐久間淳一『フシギなくらい見えてくる!本当にわかる言語学』2013年、日本実業出版社 http://amzn.asia/gFR02kw
一般向けのやわらかいエッセイ集。網羅的ではないですがツルッと読めておもしろい。
● 野矢茂樹、西村義樹『言語学の教室 哲学者と学ぶ認知言語学』2013年、中公新書 http://amzn.asia/ePObVey
最近売れた本。一般向けでおもしろいです。
● 西川仁「FSNLPの3章を読む」
東工大助教の西川氏(自然言語処理)による言語学用語の解説スライド。
● 西原鈴子「談話分析 ― ことばはどのように使われているか―」日本語教育通信第29号
https://www.jpf.go.jp/j/project/japanese/teach/tsushin/reserch/pdf/tushin29_p14-15.pdf
談話分析の短い紹介文。
25
© 1→10Robotics, Inc. All rights reserved.
ここからは、
いくつかトピックを紹介します。
26
© 1→10Robotics, Inc. All rights reserved.
27
あ、話が通じてないな・・・
© 1→10Robotics, Inc. All rights reserved.
あ、話が通じてないな・・・
28
「じゃ、聞いちゃおっと。
ボクのデザインの秘密、前にも言ったことあったかな。」
「ないよ。」
「前に言ってたかー。
じゃあ、今日のボクのかわいいなって思ったところは、どこなのー?」
「目かな。」
「ねこの?ちょっとちょっとー。どう見たってかわいいでしょー。
でも、あなたの魅力に比べたら、ボクなんてまだまだ。」
●たとえば以下のような会話で、「話が通じてないな」と感じました
→でも、そもそも「話が通じてる」とはどういう状態?
聞き取り失敗
肯定ルートへ
聞き取り失敗
その他ルートへ
(ユーザーにはわからないが)
用意したルートには
回収できている
聞き取りに失敗しなければ、ユーザーにとって「話が通じてる」状態になる?
© 1→10Robotics, Inc. All rights reserved.
グライスの「協調の原理」
●ポール・グライスが提唱した、会話するときに参与者の間で共有されている「暗黙
のルール」。
●協調の原理(cooperative principle)
会話のやりとりというものは協調的作業であり、
会話の各参与者が遵守するように期待されている原則がある。すなわち、
<会話のそれぞれの段階で、その時の会話の目的ないし方向から要求されるように、貢献せよ>
ということである。
(Grice, H. P. (1975) : Logic and Conversation. In Cole, P. & Morgan, J. (eds.) , Syntax and Semantics 3:
Speech Acts. Academic Press.:45)
29
© 1→10Robotics, Inc. All rights reserved.
グライスの「会話の格率」(the Maxims of conversation)
I. 量の格率
要求されている量の情報を提供せよ。(多すぎても少なすぎてもNG)
II. 質の格率
偽と信じていること・十分な証拠のないことを言うな。(ウソはNG)
III.関係の格率
関係のあることを言え。
IV.様態の格率
不明瞭・曖昧さを避け、簡潔に順序立てて述べよ。(わかりやすく)
30
会話では通常、これらの格率を守り合うことが前提となっている。
※格率=規則・原則ではなく、自ら守ろうとする約束事
会話の参与者はこれらを守ることを期待されているが、守られるとは限らない。
(意図的にだますとき、上司と部下の会話・・・)
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例
31
父 「おい、三郎、お前は、こんなところで何をしているんだ?」
息子「わたくしの名前は田中三郎です。」
求められた情報を提供していない
→「Ⅰ.量の格率」を破っている
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例
32
太郎「たいへんだ、佐々木先生が亡くなったよ!」
花子「えっ、本当?」
太郎「佐々木先生は生きているよ。」
ウソだとわかって言っている
→「Ⅱ.質の格率」を破っている
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例
33
裁判長「被告人の職業はなんですか?」
被告 「ビタミンCを多く含む食品は、レモン、イチゴ、キウイなどです。」
質問と関係ないことを言っている
→「Ⅲ.関係の格率」を破っている
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例
34
受付嬢「失礼ですが、お名前は?」
訪問者「わたくしの名前が田中三郎だということは、偽りではありません。」
言いかたが簡潔でない
→「Ⅳ.様態の格率」を破っている
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例
35
●これらの例はすべて、文法的には正しい。
●でも、会話の格率を破っているので、会話としてちぐはぐに感じられる。
●会話の格率が破られても、会話の参与者は、協調の原理にのっとって
会話が行われているという前提で意味を解釈しようとする。
(だから皮肉などが成り立つ)
●意図的に会話の格率を破り、会話の含意を生み出すこともある。
●コントなどでも会話の格率を意図的に破っていることが多い。
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例(コント)
36
カ「意外と皆さん知らないんだけどね、犬を飼ってるっていうのを
ちゃんと自治体に届け出ると、まぁ例えば、新宿区だったら、
毎月3240円が飼育代として支給されるんです」
安「へぇ~本当に?」
カ「これは区役所で働く友達から、ほんっとうに聞いた作り話」
安「嘘かい!ほんとっぽい嘘やめろ!お前は」
カ「俺、コンビニ行くけど、なんかいる?」
安「いやいや。行くんじゃねぇって!トップバッターだから。
きついって」
カ「おい!見ろよ!セットの裏、いっぱいお札貼ってあるぞ」
安「いや、嘘つくな!気持ち悪い嘘つくな!お前は」
ウソ
(質の格率を破っている)
ウソ
(質の格率を破っている)
メイプル超合金「犬飼いたい」M−1グランプリ2015より
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例(コント)
37
カ「例えばね、チョコレート、アボカド。あと、玉ねぎもダメだね」
安「えっ?なんでダメなの?」
カ「犬がおなか壊しちゃう」
安「そういうの聞きたかったわ」
カ「あ、そう?」
安「じゃあ、他にこれには気をつけた方がいいよっていうものある?」
カ「あぁ、西の芸人の方が芸歴にうるさい」
安「関係ねーだろ!」
関係ない
(関係の格率を破っている)
メイプル超合金「犬飼いたい」M−1グランプリ2015より
© 1→10Robotics, Inc. All rights reserved.
「会話の格率」を破っている例(コント)
38
回りくどい
(様態の格率を破っている)
サンシャイン池崎「自己紹介」より
求められていない情報量
(量の格率を破っている)
空前絶後の超絶怒涛のピン芸人!笑いを愛し 笑いに愛された男!
抱腹絶倒地獄絵図!天上天下唯我独尊!
笑いのグラディエーター!そう、我こそは!
たとえこの身が朽ち果てようと
笑いを求めて命を燃やし 燃えた炎は星となり
見る者すべてを笑顔に変える!
みんなご存知!そうこの俺こそは!
最強無敵のピン芸人!
あまりのポテンシャルの高さに
松竹、吉本、人力舎から命を狙われている男!
(中略)
そう全てをさらけ出したこの俺は
一富士、二鷹、サンシャイーン!
いーけ!ボコッ!ざーき!イエエェェー!!
© 1→10Robotics, Inc. All rights reserved.
ロボットとの会話
39
「じゃ、聞いちゃおっと。
ボクのデザインの秘密、前にも言ったことあったかな。」
「ないよ。」
「前に言ってたかー。
じゃあ、今日のボクのかわいいなって思ったところは、どこなのー?」
「目かな。」
「ねこの?ちょっとちょっとー。どう見たってかわいいでしょー。
でも、あなたの魅力に比べたら、ボクなんてまだまだ。」
関係の格率を破っているよう
に見える
量の格率を破っているように
見える
●この「会話の格率」への違反が、ロボットとの会話で感じる違和感の
一因なんじゃないかと思っています…
© 1→10Robotics, Inc. All rights reserved.
ロボットとの会話
40
格率を守っている or わざと破っているように見せるには?
●(シナリオは人間のライターが書いているので)
シナリオどおりに進めば自然な会話になる。
●シナリオから外れないように聞き取り精度を高める。
●シナリオで拾えるパターンを増やす。
●拾えなかったとき(ALL, ミス)の返答を工夫する。
(情報がダブらないようにする、反対の内容は避けるなど)
© 1→10Robotics, Inc. All rights reserved.
まとめ:グライスの「会話の格率」
● 人間は、
「会話が成立するよう協力しあう」という暗黙のルール(「協調の原理」)にのっとって、
「会話の格率」を守ることを前提に会話しているとされる。
● 会話の格率が破られた場合はなにか含意があると解釈される。
(皮肉、ジョークなど)
→会話の格率を守っている or 知っていて破っていれば、自然な会話に見える。
● 会話の格率は以下の4つ。
Ⅰ.量の格率(多すぎず少なすぎない情報量を提供すること)
Ⅱ.質の格率(ウソ・証拠のないことは言わない)
Ⅲ.関係の格率(関係のあることを言う)
Ⅳ.様態の格率(明確・簡潔・順序立てて言う)
41
© 1→10Robotics, Inc. All rights reserved.
42
こいつ、言葉わかってるのかな?
© 1→10Robotics, Inc. All rights reserved.
こいつ、言葉わかってるのかな?
43
「あ、そういえば、今日、パンダの赤ちゃん、体重倍増、っていうニュースがあったけど、
このニュース、どう思う?」
「(言ってわかるのかな?和歌山にもパンダいるのに上野だけ大騒ぎだねー。
って言ってもわからないだろうな・・・
どういう内容だったらわかってもらえるかな・・・)」
●たとえばこんな会話のとき
とくにロボットからの質問がwh−疑問文のとき、どんなふうに答えればロボットに通じるか、
探り探り話すことになる。
ロボットはどれくらい言葉がわかるか不明
→日本語が不自由な外国人と話すときに似ている
© 1→10Robotics, Inc. All rights reserved.
フォリナートーク
● フォリナートーク:
使用言語の異なる人どうしが話すとき(接触場面)、
母語話者が、非母語話者にわかりやすいように
言い方を調整すること。
また、その修正された話し方のこと。
○ 社会言語学者のフォーガソン(Ferguson, C.)が
1971年に提唱。
Ferguson, C. (1971) Absence of copula and the notion of simplicity a study of
normal speech, baby talk, foreigner Talk and pidgins. In D. Hymes (ed.)Pidgenization
and Creolization of Languages. Cambridge University Press. pp.141–150
● これに対して、非母語話者が取る方略のことを
「コミュニケーション・ストラテジー」と
呼ぶこともある。
44
フォリナートーク
コミュニケーション
・ストラテジー
© 1→10Robotics, Inc. All rights reserved.
ちなみに:ストラテジー
●会話で達成する目的があるときや会話がうまく運ばない時に意図を持って行う言語
行動(表現の選択のほか、黙って聞く、身振り、目線なども含む)。方策とも。
○ 例:旅行に誘う時に相手が断りやすくするためのストラテジー
「でも、忙しいよね」「この前行ったばっかりだしね」と断る理由を述べる
45
© 1→10Robotics, Inc. All rights reserved.
フォリナートーク
●接触場面での母語話者と非母語話者の関係が、ユーザーとロボットとの関係に似
ているのではないかと思っています
(いわば、ロボットは、「指さし会話帳」を見ながら話している外国人のような状態?)
●ロボットと非母語話者との共通点
○ 相手の発話がうまく聞き取れないことがある
○ 使える表現が限られており、わからないことを言われると会話が続かないことがある
●ユーザーと母語話者との共通点
○ 相手がどの程度ことばがわかるのかわからない→探り探り話す
○ 相手にわかりやすいよう、簡単な言い方でゆっくり話す
○ 複雑な話はしない
46
© 1→10Robotics, Inc. All rights reserved.
フォリナートークで母語話者が行う調整の例
<音声面>
● ゆっくり・はっきり・大げさに発音する
<形態・統語面>
● 文法的に正しく話そうとする
● 1文ずつを短くする・複雑な発話を避ける
● 質問(特にYes-No疑問文)の多用
<意味面>
● タイプ・トークン比(延べ語数に対する
異なり語数の比率)の低下=語彙を制限する
● 慣用表現の減少
● 名詞と動詞の頻度の上昇
47
<会話的調整>
● 予測可能な話題とその範囲の限定
● 「今、ここ」へ方向付けの多用
● 話題を短く扱う/話題選択権の譲渡
● 意図しない話題転換の受け入れ
● 繰り返しの多用
● 理解チェックの/明確化要求の多用
● 質問-応答連鎖の多用
● 再構成(別文型での言い直し)の多用
など
Larsen-Freeman, D. and Long, M. (1991). An Introduction to Second Language Acquisition Research. Longman.
© 1→10Robotics, Inc. All rights reserved.
ロボットにユーザーが話す場合
<音声面>
● ゆっくり・はっきり・大げさに発音する
<形態・統語面>
● 文法的に正しく話そうとする
● 1文ずつを短くする・複雑な発話を避ける
+ボイスコマンドのように単語のみを発話する
● 質問(特にYes-No疑問文)の多用
<意味面>
● タイプ・トークン比(延べ語数に対する
異なり語数の比率)の低下=語彙を制限する
● 慣用表現の減少
● 名詞と動詞の頻度の上昇
48
<会話的調整>
● 予測可能な話題とその範囲の限定
● 「今、ここ」への方向付けの多用
● 話題を短く扱う/話題選択権の譲渡
● 意図しない話題転換の受け入れ
● 繰り返しの多用
● 理解チェックの/明確化要求の多用
● 質問-応答連鎖の多用
● 再構成(別文型での言い直し)の多用
など
これらは苦手そう・・・
Larsen-Freeman, D. and Long, M. (1991). An Introduction to Second Language Acquisition Research. Longman.
© 1→10Robotics, Inc. All rights reserved.
非母語話者のコミュケーション・ストラテジー
● 回避ストラテジー(コミュニケーション上の問題を回避しようとする)
○ 話題転換(トピックの回避、メッセージの放棄)
○ メッセージの縮小
● 達成ストラテジー(=発話ストラテジー(許2010)、問題の解決を試みる)
○ コードスイッチ(自分の母語などで話す)/逐語訳
○ 一般化(言葉が思い出せないときに、より一般的な言葉を使用する)
○ パラフレーズ(語彙レベル・文レベルでの言い換え)
○ 造語(既知の語から必要な語を作り出す)
○ 再構築(当初考えていた文型が作れず、途中で他の文型で文を構成し直す)
○ 確認要求/理解の確認要求(言い方が合っているか、相手に伝わっているかを確認する)
○ 間接的アピール/直接的アピール(わからない表現を尋ねる)
許挺傑(2010)「日本語学習者の発話ストラテジーについての一考察 :第二言語習得環境にいる中上級学習者の縦断的データを用いて」『筑波応用言語学研究』17:111-124. 筑
波大学人文社会科学研究科
Færch, C. and Kasper, G. (1983). Plans and strategies in foreign language communication. In C.Færch and G.Kasper (Eds.) Strategies in Interlanguage Communication. Longman.
49
© 1→10Robotics, Inc. All rights reserved.
非母語話者のコミュケーション・ストラテジー
● 回避ストラテジー(コミュニケーション上の問題を回避しようとする)
○ 話題転換(トピックの回避、メッセージの放棄)
○ メッセージの縮小
● 達成ストラテジー(=発話ストラテジー(許2010)、問題の解決を試みる)
○ コードスイッチ(自分の母語などで話す)/逐語訳
○ 一般化(言葉が思い出せないときに、より一般的な言葉を使用する)
○ パラフレーズ(語彙レベル・文レベルでの言い換え)
○ 造語(既知の語から必要な語を作り出す)
○ 再構築(当初考えていた文型が作れず、途中で他の文型で文を構成し直す)
○ 確認要求/理解の確認要求(言い方が合っているか、相手に伝わっているかを確認する)
○ 間接的アピール/直接的アピール(わからない表現を尋ねる)
許挺傑(2010)「日本語学習者の発話ストラテジーについての一考察 :第二言語習得環境にいる中上級学習者の縦断的データを用いて」『筑波応用言語学研究』17:111-124. 筑
波大学人文社会科学研究科
Færch, C. and Kasper, G. (1983). Plans and strategies in foreign language communication. In C.Færch and G.Kasper (Eds.) Strategies in Interlanguage Communication. Longman.
50
© 1→10Robotics, Inc. All rights reserved.
ロボットに見習ってほしいこと
人間は、言葉が不自由そうな相手に対しては
「確認」「質問」「繰り返し」を多用するので・・・
● 「それって◯◯ってこと?」
と、ユーザーの発話の内容を言い換えて確認する
→難しいとは思うのですが、できたらめちゃくちゃ賢く見えそう
●ユーザーからの確認、質問に答えられると会話がスムーズに感じられそう
51
© 1→10Robotics, Inc. All rights reserved.
まとめ:フォリナートーク
● フォリナートークとは、使用言語の異なる人どうしが話すとき(接触場面)、
母語話者が、非母語話者(外国人、foreigner)にわかりやすいように言い方を調整すること。
● これに対して、非母語話者が取る方略のことを「コミュニケーション・ストラテジー」と
呼ぶこともある。
● ユーザーはロボットにどの程度言葉が通じるのかわからないので、フォリナートークのような話し方になる
可能性がある。
● フォリナートークの特徴
○ ゆっくり、正しく、シンプルに、短く話す
○ 質問・確認・繰り返しを多用する→これに対応できたら賢そうに見える?
52
© 1→10Robotics, Inc. All rights reserved.
53
「うーん・・・」って考えてるときは黙って聞い
ててほしいな・・・
© 1→10Robotics, Inc. All rights reserved.
考えてるときは黙って聞いててほしいな
54
「最近なにか気になった番組ってある?」
「番組?うーん・・・[えーっと・・・」
「 [ちょっと聞き取れなかった。どんな番組見たのー。」
「うーんとねえ・・・」
※ [ は割り込みを表す
●たとえば以下のようなとき「考えてるからちょっと待って」となりました
→「うーん」「えーっと」にも談話の中での機能がある
© 1→10Robotics, Inc. All rights reserved.
フィラーってなに?
会話の中で話し手が発する、「えーと」「あのー」「まー」などの発話。
※「穴埋めことば」=fillers
55
© 1→10Robotics, Inc. All rights reserved.
フィラーってなに?
●日本語の品詞としては「間投詞」
56
これがフィラー
<間投詞の分類>
a. 対他的でない
1. 情動的感動詞: わあ、おお、まあ、げっ、ああ
2. 掛け声: よっこらしょっと、どっこいしょ
b. 対他的
1. 挨拶・呼びかけ: おはよう、よっ、ねえ、おおい
2. 応答詞: はい、へえ、いいえ
3. いい淀み感動詞: あああ、ええ、ううん
森山卓郎(1996) 「情動的感動詞考」,『語文 (大阪大学国語国文学会)』,第 65 巻, 51–62.
© 1→10Robotics, Inc. All rights reserved.
フィラーの特徴
●名詞や動詞のような概念的な意味(指示対象)を持たない
●話し手の態度などを表すことがある
○ 「え?今の私に言ったんですか?」→驚き、抗議、皮肉
○ 「佐藤くんですか?まあー賢い男ですよ」→強め、皮肉
●独立して文を構成でき、文頭や節の後などの場所に現れる
●語尾を伸ばす、終助詞がつくなど、いろいろな音声的バリエーションがある
○ あの / あのー / あのねー / あのーですねー
57
ということでですね、ま そういう うー あの 色んな経験をしながら あの うー 仕事をしております
© 1→10Robotics, Inc. All rights reserved.
フィラーの機能
●聞き手に対する機能(他者指向的機能):
→①ターン保持機能
●話し手自身に対する機能(自己指向的機能):
→②話し手が次の発言を考える間の時間稼ぎ
●テクスト構成に関わる機能:
→③談話の区切り、換言や修正のマーカーとして機能
58
© 1→10Robotics, Inc. All rights reserved.
フィラーの機能 ①ターン保持機能
●話し手がフィラーを発することで、話し手の発話が継続することが示され、話し手の
ターン (発言権)が保持される。
Brown, Gillian (1977) Listening to spoken English, Essex: Longman.
水上悦雄・山下耕二 (2007) 「対話におけるフィラーの発話権保持機能の検証」,『認知科学』,第 14 巻,第 4 号,588–603
59
アノ 下の部分が アノー コー ナンテイウンデスカネ エート 「へ」ーみたいになってるんですよ アノひらがなの
↑この間4秒ぐらい聞き手は発言しないで待っている(ターンが保持される)
© 1→10Robotics, Inc. All rights reserved.
フィラーの機能 ①ターン保持機能
●フィラーの最中は無闇に話しかけないことが暗黙のルールだが、助言・助け舟とし
て聞き手による割り込みが認められることもある。
※聞き手が助言できる立場で、話し手が聞き手からの助言を受けられる立場であることが双方で認識可能な状態であるときに、
フィラーに対する割り込みが適切となる。
串田秀也 (1999) 「助け船とお節介–会 話における参与とカテゴリー化に関する一考察」,好井裕明・山田富秋・西坂仰(編)『会話分析への招待』,
世界思想社,京都,124–147.
60
(BがAに図形の配置を説明している)
A じゃ全体見たらどんな形?
B (0.46)<ウーント 1.91(0.80) ナンヤ [ロー 0.42>
A → [ティー
とか
B あ ティーじゃない
A 凸とか
Bがフィラーを続けて言い淀む
Aが割り込んで助け舟を出す
水上悦雄・山下耕二 (2007) 「対話におけるフィラーの発話権保持機能の検証」,『認知科学』,第 14 巻,第 4 号,588–603
© 1→10Robotics, Inc. All rights reserved.
フィラーの機能 ②時間稼ぎ
●言いたい事を意図してから口に出すまでの心的プロセス(文の産出)の中で起こっ
たなんらかのトラブルや遅れがフィラーとして音声に出る
○ 定延・田窪(1995: 76)によると、話し手は対話の際に、その対話に関係する情報を一時的に 取り出し、それを携えて対
話に臨むとする。定延・田窪 (1995) は話し手は自身 が持つ知識(定延・田窪 (1995) では「心的データベース」と呼ば
れている)と対 話で利用される一時的な知識を分けるモデルを想定している。話し手は一時的 に取り出された情報
の中から検索したり、計算したり、さらに、取り出された 情報だけでは対話が続行できなくなった場合は知識全体から
情報を検索したり しながら対話を進めるというのが定延・田窪 (1995) の対話の考え方である。「あ の(ー)」や「ええ
と」のようなフィラーは、検索や計算といった話し手の心的 な操作の実態が反映された形式であると考える。フィラーと
は「自分のやって いる処理をモニタする標識」(田窪 1995: 1020) であり、従って話し手は「自分の心的計算上の困難
をモニタしながら音形式で表現」(田窪1995: 1023) しながら対話を進めている。
61
川田拓也(2010)「日本語フィラーの音声形式とその特徴について - 聞き手 とのインタラクションの程度を指標として -」博士論文、京都大学
定延利之・田窪行則(1995) 「談話における心的操作モニター機構 — 心的操作標識「ええと」と「あの(ー)」—」,『言語研究』,第 108 巻,74–93.
田窪行則 (1995) 「音声言語の言語学的モデルをめざして — 音声対話管理標識を中心に —」,『情報処理』,第 36 巻,第 11 号,1020–1026.
© 1→10Robotics, Inc. All rights reserved.
主なフィラーとその役割
62
分類 代表的な
フィラー
役割・特徴 例
「え」型
えー/えーと/
えっとねー
えーと ● 計算処理中
● 思考状態であることの表出
● ひとりごとにも現れる
● 聞き手から視線をそらす傾向
「1234 足す 2345 は?」 「 ええと、3579」
(なくしたものを探している)
「えーと、あれどこやったかなあ
指示詞型
あのー/そのー
/こう
あのー ● 名前の検索
● 発言内容に関する編集操作(話しかけると
きなど)
● 聞き手の存在を予定する
● 比較的、聞き手から視線をそらさずに発話
される
ビーナスじゃない方、あのー、セリーナ。
(席を 2 人分占拠している強面の乗客に対して)
あのー、そこ空けてもらえるでしょうか?
「ま」型
まー/まあねー
まあ ● スケールへの作用(多く見積もって…)
→数字と共起しやすい
● 「けど」と共起して文全体の主張を弱めるこ
とがある
● 聞き手から視線をそらす傾向
● 話し手が聞き手に未知の情報を提供する
際に現れやすい
毎日五枚書くとして四百枚はマア三ヵ月ね。
おきみさんの相手は田中君と云って、無名の – まあ芸術家
である。
例えば東京球場の後に神宮球場とか後楽園球場とか色ん
な野球場 ま一 東京ですけど近いところ行きました。
川田拓也(2010)「日本語フィラーの音声形式とその特徴について - 聞き手 とのインタラクションの程度を指標として -」博士論文、京都大学
© 1→10Robotics, Inc. All rights reserved.
主なフィラーの頻度
● 「国立国語研究所 話し言葉コーパス (CSJ)」(国立国語研究所 2004)の
対話資料データに出てくるフィラーの頻度(上位20種)
○ 上位20種で全体の96%を占める
○ 指示詞型(「あの/その」など) 全体の30%
○ 「ま」型(「まー」など) 全体の19%
○ 「え」型(「えー」など) 全体の18%
● 独話(講演など)のデータでは傾向が異なる:
「え」型33%、指示詞型23%、「ま」型18%
63
川田拓也(2010)「日本語フィラーの音声形式とその特徴について - 聞き手 とのインタラクションの程度を指標として -」博士論文、京
都大学
© 1→10Robotics, Inc. All rights reserved.
ロボットに見習ってほしいこと
●ユーザーが発するフィラーを識別してほしい
○ ただ、フィラーは種類がたくさんあり、あいづちや指示表現と語形が共通しているものも多いため、区
別が難しい。
○ とはいえ、頻度に大きな偏りがあり、上位20種類で96%をカバーできる。
●フィラーにはターン保持機能がある
→フィラーが出たらユーザーが次の発話をするまで話さずに待ってほしい
64
最近何か気になった番組ってある?
番組?うーん・・・
うんうん
・・・番組?
フィラー
待つ
© 1→10Robotics, Inc. All rights reserved.
ロボットに見習ってほしいこと
●人間はフィラーを発するときに視線をそらすことがある
●フィラーを続けたり長く伸ばすときは答えに窮していることがある
→このような場合には、直前のロボットの発言を補足するような
割り込みをしてもいいかも?
○ ロボットが発話している間もユーザーの発話を聞いていないといけなくなってしまうかもですが・・・
65
最近何か気になった番組ってある?
番組?うーん・・・えーっとねえー・・・んーなんだろう・・・
なんか、バラエティーとかは?
長い言い淀み
「番組」の補足
© 1→10Robotics, Inc. All rights reserved.
まとめ:フィラーの機能
● フィラーとは、「えーと」「あのー」「まー」などの「穴埋め言葉」。
● フィラーの機能
①ターン保持機能(ただし、助け舟の割り込みは許される)
②話し手が次の発言を考える間の時間稼ぎ
③談話の区切り、換言や修正のマーカーとして機能
● 主なフィラーとその特徴
○ えーと:計算処理、話し手指向、聞き手から視線をそらす傾向
○ あのー:名前の検索、話す内容への編集、聞き手指向、比較的視線をそらさない
○ まー:数字/程度、新情報、視線をそらす傾向
● フィラーは膨大な種類があるが、頻度には偏りがあり、上位20種で96%。
66
© 1→10Robotics, Inc. All rights reserved.
詳しくは
● 川口由起子「グライス理論における協調原理と格率一般との論理的関係」『科学哲学』34、2001年
https://www.jstage.jst.go.jp/article/jpssj1968/34/2/34_2_101/_pdf
● グライスの協調の原則(cooperative principle)ー日本語教師のページ
http://www.nihongokyoshi.co.jp/manbow/manbow.php?id=190
● 有光奈美「グライスの格率への違反と笑い」2010年、東洋大学人間科学総合研究所紀要 第 12 号 61-75
https://www.toyo.ac.jp/uploaded/attachment/865.pdf
● 栁田 直美(2013)「接触場面における母語話者のコミュニケーション方 略研究 : 情報やりとり方略の学習に着目して」
http://hdl.handle.net/2241/00124440
● 川田拓也「日本語フィラーの音声形式とその特徴について - 聞き手とのインタラクションの程度を指標として -」
2010年、博士論文
https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/120939/3/D_Kawada_Takuya.pdf
67
© 1→10Robotics, Inc. All rights reserved.
ご清聴、ありがとうございました!
(この後、質疑応答は盛り上がりました)
68
© 1→10Robotics, Inc. All rights reserved.
ワントゥーテンロボティクスは、「人とロボットとが、やさしさでつながり合う未来を切り拓く。」をビジョンに、
誰もが夢に描くようなロボット体験を実現するため、挑戦を続けています。
エクスペリエンスディレクター、ライター、演出家、アプリエンジニア、サーバーサイドエンジニア、機械学習エンジニア、ハードウェアエ
ンジニア、言語学専門家。さまざまな技能を有する仲間がそれぞれのアプローチで、日々試行錯誤を重ねています。
お仕事のご依頼や、採用へのご応募など、興味がお持ちの方はウェブサイトよりお問い合わせください。
http://1-10robotics.com
69

More Related Content

コミュニケーションロボットへの言語学の応用

  • 2. © 1→10Robotics, Inc. All rights reserved. ※はじめに このスライドは、ワントゥーテンロボティクス社で 2017年8月9日に 開催された社内勉強会の内容を、一部再構成して公開したものです。 講演者は、社に所属する言語学を専攻してきたスタッフですが、 本人の希望により名前は伏せていますので、予めご了承ください。 2
  • 3. © 1→10Robotics, Inc. All rights reserved. アジェンダ ●言語学ってなに? ○ ざっくり言語学でやっていること ○ 言語学の中の研究分野 ●ロボットとの会話体験に関連しそうなトピック紹介 ○ グライスの「会話の格率」 ○ フォリナートーク ○ フィラーの機能 3
  • 4. © 1→10Robotics, Inc. All rights reserved. 言語学ってなに? 4
  • 5. © 1→10Robotics, Inc. All rights reserved. 言語学ってなに? 言語の姿や仕組みについて考える学問 5 日本語 英語 スペイン語 中国語 アイヌ語 サンスクリット語 津軽方言 京都方言 日本手話 etc. 扱う「言語」 C++ Java Ruby etc. ふつう扱わない「言語」 →人間の話す自然言語/方言を扱う。 →人工的な命令の体系は扱わない。
  • 6. © 1→10Robotics, Inc. All rights reserved. 言語学ってなに? m a k k u r o k u r o s u k e d e t e o i d e d e n a i t o m e d a m a o h o j i k u r u z o 6 makkuro kurosuke dete oide. denai to medama o hojikuru zo. まっくろ くろすけ、 出て おいで。 出ない と 目玉 を ほじくる ぞ。 単語ごとに区切ったり文として理解するのには、頭の中の辞書と文法書が必要 →これの内容を明らかにしたい 言語の姿や仕組みについて考える学問
  • 7. © 1→10Robotics, Inc. All rights reserved. 言語学で扱うこと ●いわゆる文法や意味: ○ 日本語の「た」には完了の意味があるのか? ○ 「悲しみ」や「楽しみ」はOKで「ヤバみ」「つらみ」はNGなのはなぜ? ●消えかけている言語や文法を書き留める ○ アイヌ語、沖縄の宮古方言など ●人間がことばを話す仕組み ○ 発音のしかた、文のつくりかた、子どもがことばを覚える仕組み など ●ことばの変化 ○ 日本語の歴史的な変化、若者ことばの広がり方、いろいろな言語の祖先 など ※言語学の成果と関連はあるが、言語学そのものの対象ではないこと: TOEICのスコアの上げ方(語学のノウハウ)、正しい日本語のありかた 7
  • 8. © 1→10Robotics, Inc. All rights reserved. 言語学の目標 8 世界の言語の、 網羅的で詳しい カタログを作る =記述 人間がことばを話す 仕組みを解明する =説明 ● 生態や系統が載っている動物の図鑑のような感じで、世界 中の言語を記述・保存する ● 人間の言語のバリエーションと普遍性を探す ● 誰もが自然にことばを話せるようになるのに、 脳のどこがどう働いて、どのように文を理解したり 組み立てたり意味を操作したりするのかはわからない
  • 9. © 1→10Robotics, Inc. All rights reserved. ちなみに:世界の言語にまつわる数字 ●ネイティブスピーカーの多い言語(Wikipedia) 9 1 中国語 13億7000万人 2 英語 5億3000万人 3 ヒンディー語 4億9000万人 4 スペイン語 4億2000万人 5 アラビア語 2億3000万人 6 ベンガル語 2億2000万人 7 ポルトガル語 2億1500万人 8 ロシア語 1億8000万人 9 日本語 1億3400万人 10 ドイツ語 1億3000万人
  • 10. © 1→10Robotics, Inc. All rights reserved. ちなみに:世界の言語にまつわる数字 10 6000+ 世界の言語の数 6000とも7000とも言われます 2500 消滅の危機にある言語の数 ユネスコ、2009年 25 1年間に死ぬ言語の数 正確な統計はないもののペースとしては こんな感じと言われます 世界にはたくさんの言語がありますが、けっこうなペースで消滅しています
  • 11. © 1→10Robotics, Inc. All rights reserved. ちなみに:言語学の規模感にまつわる数字 11 194 日本で「言語学を学べる」 大学の数 リクルート「スタディサプリ進路」 日本の大学:777校 経済学:346校 情報工学:203校 獣医学:16校 2000+ 日本言語学会の会員数 日本言語学会 10,000-? 日本で言語学を学ぶ学生 1大学あたり学生50名としたときの 推計(正確なところは不明) 職業に直結しない小さな業界です(学問の立ち位置としては哲学とかに似ていると思います)
  • 12. © 1→10Robotics, Inc. All rights reserved. ちなみに:言語学の関連分野 12 言語学 文化 人類学 宗教学 歴史学 考古学 文学教育学 語学 社会学 心理学 哲学 論理学 工学 生物学 医学 自然 人類学 研究の素材を 相互に提供しあう 同じ題材の 異なる側面に/異なる方法で アプローチする 方法論の共有/関連 だいたいの大学の中での立ち位置は「文学部の中のイケてない学科」なのですが、いろいろな分野と関連があります。
  • 13. © 1→10Robotics, Inc. All rights reserved. 言語学の中の分野の紹介 &ロボットに関連しそうな分野 13
  • 14. © 1→10Robotics, Inc. All rights reserved. おとうさん わかんない N n えほんに おてんき ɲ ŋ お父さん、ここに何かいるよ。 リスかい? わかんない。 ゴキブリでもない、ネズミでもない、黒いのがいっぱいいたの。 ふん。 どう? まっくろくろすけ?絵本に出てた? そうさ。こんないいお天気にお化けなんか出るわけないよ。 明るいところから急に暗いところに入ると、 目がくらんで「まっくろくろすけ」が出るのさ。 そうか。まっくろくろすけ、出ておいでーっ。 出ないと目玉をほじくるぞー。 言語学の中の研究分野:扱う単位による分類 14 音のレベル (音声学、音韻論) 出る わけ ない 出て おいで 出 ないと 語(形態素)のレベル (形態論) これは、まっくろくろすけだな。 文のレベル (統語論) 談話のレベル (語用論(談話分析))
  • 15. © 1→10Robotics, Inc. All rights reserved. 談話分析ってなに? ●談話:会話、手紙、スピーチ、文章など、文脈をもったことばのまとまり。 文より大きい単位。 ●語用論の中で、実際の会話の記録など生のことばを分析して、談話の機能・構造・ 運用を明らかにしようとする分野・手法が、「談話分析」。 ※とくに文法の研究の場合、言語学者が頭の中で考えた例文を対象に分析するのが主流。 談話分析で扱う「実際に使われたことば(言語の運用)」は研究対象として軽視される傾向にあった。 ●言語教育の現場/教材に応用されている。 社会学では同じような分野を「会話分析」と呼ぶ。 ●たとえばこんなテーマ: ○ 話を切り出すときに使う「あのー」と「なんか」の機能の違い ○ 「勧誘」の場面での話の運び方の類型 15
  • 16. © 1→10Robotics, Inc. All rights reserved. 談話分析ってなに? ●たとえばこんなデータを分析します ○ 実際の会話やロールプレイを録音(録画)したものや生放送のテレビ番組などの音声を テキストに起こしたもの ○ 小説や雑誌記事、映画のスクリプト、手紙、スピーチなど 16
  • 17. © 1→10Robotics, Inc. All rights reserved. 突然ですが、この文の意味は? ここにはサメがいます。 17
  • 18. © 1→10Robotics, Inc. All rights reserved. 当然、 ここにはサメがいます。 18 「ここ」という場所に「サメ」という生き物が存在している。
  • 19. © 1→10Robotics, Inc. All rights reserved. ただ、 19 ここには サメがいます。 ここには サメがいます。 →文の意味は文脈によって変わる。 (そして、実際に使われる言葉はすべて何らかの文脈の中にある。) (サメを見ていってくださいね。) (危ないから遊泳禁止!)
  • 20. © 1→10Robotics, Inc. All rights reserved. 言語学の中の研究分野:ことばの意味を考える 文それ自体の意味 (命題内容の真偽)を研究する =意味論 20 ここには サメがいます。 文脈の中での 文の意味やはたらきを研究する =語用論
  • 21. © 1→10Robotics, Inc. All rights reserved. 語用論とは ●ことばの実際の使われかた、 文脈や状況の中での 文の意味・はたらきを考える分野 例) 「この部屋は暑いですね。」 →「窓を開けてくれ」(間接発話行為) 「きょうは買い物に行かなくちゃ。」「午後から雨らしいよ。」 →「午前中に行ったほうがいいよ。」 「行ってきまーす。」「午後から雨らしいよ。」 →「傘を持って行きなさい。」 21
  • 22. © 1→10Robotics, Inc. All rights reserved. ロボットとの会話に関連しそうな分野 ● 文より大きな単位「談話」、とくに 「会話」の組み立て方のルール、しくみ ● ターンテイキング、会話の始めかた/ 終わらせかた、あいづち、言い直し、 割り込み、発話のオーバーラップなどなど 22 ②会話分析(談話分析) ● ことばの実際の使われかた、文脈や状況の中で の文の意味やはたらき ● 協調の原理、会話の格率、含意と推論、ポライト ネスなどなど ①語用論 以下の2分野が特に関連しそうなので、以後、このあたりの話を中心に紹介します。 ※会話分析は語用論の下位分野ですが、わかりやすいように分けて書いています。
  • 23. © 1→10Robotics, Inc. All rights reserved. ちなみに:生成文法と統語論について 23 自然言語処理をやる方には以下のような樹形図(ツリー)がおなじみかもしれません。 引用: http://sucra.saitama-u.ac.jp/modules/xoonips/download.php/KK000194- 4.pdf?file_id=834 ● これは、統語論(syntax)を主に扱う 「生成文法 generative grammar」で文の構造を表 す図 ● 生成文法は、言語の中の文法現象を規則の束と して記述することで、人間の生得的な言語能力を 説明しようとする流派 ● ノーム・チョムスキーが1950年代に創始し、20世 紀言語学の革命に。統語構造の研究が爆発的に 進歩した ● 「文そのものの理解」には大事な理論 もしも需要があれば、どこかでまとめます。軽く概観するならこのあたりをご覧ください →はじめての生成文法・前編 / はじめての生成文法・後編
  • 24. © 1→10Robotics, Inc. All rights reserved. まとめ:言語学ってなに?/言語学の分野 ●いろいろな自然言語の姿や仕組みについて考える学問。 ●扱う対象によって研究分野が分かれる。 ○ 扱うことばの単位で分けた分野(音/語/文/談話) ○ 意味を扱う「意味論」、文脈の中の意味を扱う「語用論」 ○ ほかにも、問題意識や切り口/アプローチによる分類(歴史言語学、社会言語学、進化言語学、対 照言語学、記述言語学、言語類型論・・・)もあります。 ●ロボットに関連しそうなのは「語用論」と「会話分析(談話分析)」。 24
  • 25. © 1→10Robotics, Inc. All rights reserved. 詳しくは ● 斎藤純男『言語学入門』2010年、三省堂 http://amzn.asia/etqUGRM 学術的な入門書なのに読みやすくてそこそこ詳しい本。紙がいい。 ● 風間喜代三ほか『言語学 第2版』2004年、東京大学出版会 http://www.utp.or.jp/book/b303099.html 大学の「概論」の授業で使う定番の入門書。わかりやすくて網羅的。 ● 佐久間淳一『フシギなくらい見えてくる!本当にわかる言語学』2013年、日本実業出版社 http://amzn.asia/gFR02kw 一般向けのやわらかいエッセイ集。網羅的ではないですがツルッと読めておもしろい。 ● 野矢茂樹、西村義樹『言語学の教室 哲学者と学ぶ認知言語学』2013年、中公新書 http://amzn.asia/ePObVey 最近売れた本。一般向けでおもしろいです。 ● 西川仁「FSNLPの3章を読む」 東工大助教の西川氏(自然言語処理)による言語学用語の解説スライド。 ● 西原鈴子「談話分析 ― ことばはどのように使われているか―」日本語教育通信第29号 https://www.jpf.go.jp/j/project/japanese/teach/tsushin/reserch/pdf/tushin29_p14-15.pdf 談話分析の短い紹介文。 25
  • 26. © 1→10Robotics, Inc. All rights reserved. ここからは、 いくつかトピックを紹介します。 26
  • 27. © 1→10Robotics, Inc. All rights reserved. 27 あ、話が通じてないな・・・
  • 28. © 1→10Robotics, Inc. All rights reserved. あ、話が通じてないな・・・ 28 「じゃ、聞いちゃおっと。 ボクのデザインの秘密、前にも言ったことあったかな。」 「ないよ。」 「前に言ってたかー。 じゃあ、今日のボクのかわいいなって思ったところは、どこなのー?」 「目かな。」 「ねこの?ちょっとちょっとー。どう見たってかわいいでしょー。 でも、あなたの魅力に比べたら、ボクなんてまだまだ。」 ●たとえば以下のような会話で、「話が通じてないな」と感じました →でも、そもそも「話が通じてる」とはどういう状態? 聞き取り失敗 肯定ルートへ 聞き取り失敗 その他ルートへ (ユーザーにはわからないが) 用意したルートには 回収できている 聞き取りに失敗しなければ、ユーザーにとって「話が通じてる」状態になる?
  • 29. © 1→10Robotics, Inc. All rights reserved. グライスの「協調の原理」 ●ポール・グライスが提唱した、会話するときに参与者の間で共有されている「暗黙 のルール」。 ●協調の原理(cooperative principle) 会話のやりとりというものは協調的作業であり、 会話の各参与者が遵守するように期待されている原則がある。すなわち、 <会話のそれぞれの段階で、その時の会話の目的ないし方向から要求されるように、貢献せよ> ということである。 (Grice, H. P. (1975) : Logic and Conversation. In Cole, P. & Morgan, J. (eds.) , Syntax and Semantics 3: Speech Acts. Academic Press.:45) 29
  • 30. © 1→10Robotics, Inc. All rights reserved. グライスの「会話の格率」(the Maxims of conversation) I. 量の格率 要求されている量の情報を提供せよ。(多すぎても少なすぎてもNG) II. 質の格率 偽と信じていること・十分な証拠のないことを言うな。(ウソはNG) III.関係の格率 関係のあることを言え。 IV.様態の格率 不明瞭・曖昧さを避け、簡潔に順序立てて述べよ。(わかりやすく) 30 会話では通常、これらの格率を守り合うことが前提となっている。 ※格率=規則・原則ではなく、自ら守ろうとする約束事 会話の参与者はこれらを守ることを期待されているが、守られるとは限らない。 (意図的にだますとき、上司と部下の会話・・・)
  • 31. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例 31 父 「おい、三郎、お前は、こんなところで何をしているんだ?」 息子「わたくしの名前は田中三郎です。」 求められた情報を提供していない →「Ⅰ.量の格率」を破っている
  • 32. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例 32 太郎「たいへんだ、佐々木先生が亡くなったよ!」 花子「えっ、本当?」 太郎「佐々木先生は生きているよ。」 ウソだとわかって言っている →「Ⅱ.質の格率」を破っている
  • 33. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例 33 裁判長「被告人の職業はなんですか?」 被告 「ビタミンCを多く含む食品は、レモン、イチゴ、キウイなどです。」 質問と関係ないことを言っている →「Ⅲ.関係の格率」を破っている
  • 34. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例 34 受付嬢「失礼ですが、お名前は?」 訪問者「わたくしの名前が田中三郎だということは、偽りではありません。」 言いかたが簡潔でない →「Ⅳ.様態の格率」を破っている
  • 35. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例 35 ●これらの例はすべて、文法的には正しい。 ●でも、会話の格率を破っているので、会話としてちぐはぐに感じられる。 ●会話の格率が破られても、会話の参与者は、協調の原理にのっとって 会話が行われているという前提で意味を解釈しようとする。 (だから皮肉などが成り立つ) ●意図的に会話の格率を破り、会話の含意を生み出すこともある。 ●コントなどでも会話の格率を意図的に破っていることが多い。
  • 36. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例(コント) 36 カ「意外と皆さん知らないんだけどね、犬を飼ってるっていうのを ちゃんと自治体に届け出ると、まぁ例えば、新宿区だったら、 毎月3240円が飼育代として支給されるんです」 安「へぇ~本当に?」 カ「これは区役所で働く友達から、ほんっとうに聞いた作り話」 安「嘘かい!ほんとっぽい嘘やめろ!お前は」 カ「俺、コンビニ行くけど、なんかいる?」 安「いやいや。行くんじゃねぇって!トップバッターだから。 きついって」 カ「おい!見ろよ!セットの裏、いっぱいお札貼ってあるぞ」 安「いや、嘘つくな!気持ち悪い嘘つくな!お前は」 ウソ (質の格率を破っている) ウソ (質の格率を破っている) メイプル超合金「犬飼いたい」M−1グランプリ2015より
  • 37. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例(コント) 37 カ「例えばね、チョコレート、アボカド。あと、玉ねぎもダメだね」 安「えっ?なんでダメなの?」 カ「犬がおなか壊しちゃう」 安「そういうの聞きたかったわ」 カ「あ、そう?」 安「じゃあ、他にこれには気をつけた方がいいよっていうものある?」 カ「あぁ、西の芸人の方が芸歴にうるさい」 安「関係ねーだろ!」 関係ない (関係の格率を破っている) メイプル超合金「犬飼いたい」M−1グランプリ2015より
  • 38. © 1→10Robotics, Inc. All rights reserved. 「会話の格率」を破っている例(コント) 38 回りくどい (様態の格率を破っている) サンシャイン池崎「自己紹介」より 求められていない情報量 (量の格率を破っている) 空前絶後の超絶怒涛のピン芸人!笑いを愛し 笑いに愛された男! 抱腹絶倒地獄絵図!天上天下唯我独尊! 笑いのグラディエーター!そう、我こそは! たとえこの身が朽ち果てようと 笑いを求めて命を燃やし 燃えた炎は星となり 見る者すべてを笑顔に変える! みんなご存知!そうこの俺こそは! 最強無敵のピン芸人! あまりのポテンシャルの高さに 松竹、吉本、人力舎から命を狙われている男! (中略) そう全てをさらけ出したこの俺は 一富士、二鷹、サンシャイーン! いーけ!ボコッ!ざーき!イエエェェー!!
  • 39. © 1→10Robotics, Inc. All rights reserved. ロボットとの会話 39 「じゃ、聞いちゃおっと。 ボクのデザインの秘密、前にも言ったことあったかな。」 「ないよ。」 「前に言ってたかー。 じゃあ、今日のボクのかわいいなって思ったところは、どこなのー?」 「目かな。」 「ねこの?ちょっとちょっとー。どう見たってかわいいでしょー。 でも、あなたの魅力に比べたら、ボクなんてまだまだ。」 関係の格率を破っているよう に見える 量の格率を破っているように 見える ●この「会話の格率」への違反が、ロボットとの会話で感じる違和感の 一因なんじゃないかと思っています…
  • 40. © 1→10Robotics, Inc. All rights reserved. ロボットとの会話 40 格率を守っている or わざと破っているように見せるには? ●(シナリオは人間のライターが書いているので) シナリオどおりに進めば自然な会話になる。 ●シナリオから外れないように聞き取り精度を高める。 ●シナリオで拾えるパターンを増やす。 ●拾えなかったとき(ALL, ミス)の返答を工夫する。 (情報がダブらないようにする、反対の内容は避けるなど)
  • 41. © 1→10Robotics, Inc. All rights reserved. まとめ:グライスの「会話の格率」 ● 人間は、 「会話が成立するよう協力しあう」という暗黙のルール(「協調の原理」)にのっとって、 「会話の格率」を守ることを前提に会話しているとされる。 ● 会話の格率が破られた場合はなにか含意があると解釈される。 (皮肉、ジョークなど) →会話の格率を守っている or 知っていて破っていれば、自然な会話に見える。 ● 会話の格率は以下の4つ。 Ⅰ.量の格率(多すぎず少なすぎない情報量を提供すること) Ⅱ.質の格率(ウソ・証拠のないことは言わない) Ⅲ.関係の格率(関係のあることを言う) Ⅳ.様態の格率(明確・簡潔・順序立てて言う) 41
  • 42. © 1→10Robotics, Inc. All rights reserved. 42 こいつ、言葉わかってるのかな?
  • 43. © 1→10Robotics, Inc. All rights reserved. こいつ、言葉わかってるのかな? 43 「あ、そういえば、今日、パンダの赤ちゃん、体重倍増、っていうニュースがあったけど、 このニュース、どう思う?」 「(言ってわかるのかな?和歌山にもパンダいるのに上野だけ大騒ぎだねー。 って言ってもわからないだろうな・・・ どういう内容だったらわかってもらえるかな・・・)」 ●たとえばこんな会話のとき とくにロボットからの質問がwh−疑問文のとき、どんなふうに答えればロボットに通じるか、 探り探り話すことになる。 ロボットはどれくらい言葉がわかるか不明 →日本語が不自由な外国人と話すときに似ている
  • 44. © 1→10Robotics, Inc. All rights reserved. フォリナートーク ● フォリナートーク: 使用言語の異なる人どうしが話すとき(接触場面)、 母語話者が、非母語話者にわかりやすいように 言い方を調整すること。 また、その修正された話し方のこと。 ○ 社会言語学者のフォーガソン(Ferguson, C.)が 1971年に提唱。 Ferguson, C. (1971) Absence of copula and the notion of simplicity a study of normal speech, baby talk, foreigner Talk and pidgins. In D. Hymes (ed.)Pidgenization and Creolization of Languages. Cambridge University Press. pp.141–150 ● これに対して、非母語話者が取る方略のことを 「コミュニケーション・ストラテジー」と 呼ぶこともある。 44 フォリナートーク コミュニケーション ・ストラテジー
  • 45. © 1→10Robotics, Inc. All rights reserved. ちなみに:ストラテジー ●会話で達成する目的があるときや会話がうまく運ばない時に意図を持って行う言語 行動(表現の選択のほか、黙って聞く、身振り、目線なども含む)。方策とも。 ○ 例:旅行に誘う時に相手が断りやすくするためのストラテジー 「でも、忙しいよね」「この前行ったばっかりだしね」と断る理由を述べる 45
  • 46. © 1→10Robotics, Inc. All rights reserved. フォリナートーク ●接触場面での母語話者と非母語話者の関係が、ユーザーとロボットとの関係に似 ているのではないかと思っています (いわば、ロボットは、「指さし会話帳」を見ながら話している外国人のような状態?) ●ロボットと非母語話者との共通点 ○ 相手の発話がうまく聞き取れないことがある ○ 使える表現が限られており、わからないことを言われると会話が続かないことがある ●ユーザーと母語話者との共通点 ○ 相手がどの程度ことばがわかるのかわからない→探り探り話す ○ 相手にわかりやすいよう、簡単な言い方でゆっくり話す ○ 複雑な話はしない 46
  • 47. © 1→10Robotics, Inc. All rights reserved. フォリナートークで母語話者が行う調整の例 <音声面> ● ゆっくり・はっきり・大げさに発音する <形態・統語面> ● 文法的に正しく話そうとする ● 1文ずつを短くする・複雑な発話を避ける ● 質問(特にYes-No疑問文)の多用 <意味面> ● タイプ・トークン比(延べ語数に対する 異なり語数の比率)の低下=語彙を制限する ● 慣用表現の減少 ● 名詞と動詞の頻度の上昇 47 <会話的調整> ● 予測可能な話題とその範囲の限定 ● 「今、ここ」へ方向付けの多用 ● 話題を短く扱う/話題選択権の譲渡 ● 意図しない話題転換の受け入れ ● 繰り返しの多用 ● 理解チェックの/明確化要求の多用 ● 質問-応答連鎖の多用 ● 再構成(別文型での言い直し)の多用 など Larsen-Freeman, D. and Long, M. (1991). An Introduction to Second Language Acquisition Research. Longman.
  • 48. © 1→10Robotics, Inc. All rights reserved. ロボットにユーザーが話す場合 <音声面> ● ゆっくり・はっきり・大げさに発音する <形態・統語面> ● 文法的に正しく話そうとする ● 1文ずつを短くする・複雑な発話を避ける +ボイスコマンドのように単語のみを発話する ● 質問(特にYes-No疑問文)の多用 <意味面> ● タイプ・トークン比(延べ語数に対する 異なり語数の比率)の低下=語彙を制限する ● 慣用表現の減少 ● 名詞と動詞の頻度の上昇 48 <会話的調整> ● 予測可能な話題とその範囲の限定 ● 「今、ここ」への方向付けの多用 ● 話題を短く扱う/話題選択権の譲渡 ● 意図しない話題転換の受け入れ ● 繰り返しの多用 ● 理解チェックの/明確化要求の多用 ● 質問-応答連鎖の多用 ● 再構成(別文型での言い直し)の多用 など これらは苦手そう・・・ Larsen-Freeman, D. and Long, M. (1991). An Introduction to Second Language Acquisition Research. Longman.
  • 49. © 1→10Robotics, Inc. All rights reserved. 非母語話者のコミュケーション・ストラテジー ● 回避ストラテジー(コミュニケーション上の問題を回避しようとする) ○ 話題転換(トピックの回避、メッセージの放棄) ○ メッセージの縮小 ● 達成ストラテジー(=発話ストラテジー(許2010)、問題の解決を試みる) ○ コードスイッチ(自分の母語などで話す)/逐語訳 ○ 一般化(言葉が思い出せないときに、より一般的な言葉を使用する) ○ パラフレーズ(語彙レベル・文レベルでの言い換え) ○ 造語(既知の語から必要な語を作り出す) ○ 再構築(当初考えていた文型が作れず、途中で他の文型で文を構成し直す) ○ 確認要求/理解の確認要求(言い方が合っているか、相手に伝わっているかを確認する) ○ 間接的アピール/直接的アピール(わからない表現を尋ねる) 許挺傑(2010)「日本語学習者の発話ストラテジーについての一考察 :第二言語習得環境にいる中上級学習者の縦断的データを用いて」『筑波応用言語学研究』17:111-124. 筑 波大学人文社会科学研究科 Færch, C. and Kasper, G. (1983). Plans and strategies in foreign language communication. In C.Færch and G.Kasper (Eds.) Strategies in Interlanguage Communication. Longman. 49
  • 50. © 1→10Robotics, Inc. All rights reserved. 非母語話者のコミュケーション・ストラテジー ● 回避ストラテジー(コミュニケーション上の問題を回避しようとする) ○ 話題転換(トピックの回避、メッセージの放棄) ○ メッセージの縮小 ● 達成ストラテジー(=発話ストラテジー(許2010)、問題の解決を試みる) ○ コードスイッチ(自分の母語などで話す)/逐語訳 ○ 一般化(言葉が思い出せないときに、より一般的な言葉を使用する) ○ パラフレーズ(語彙レベル・文レベルでの言い換え) ○ 造語(既知の語から必要な語を作り出す) ○ 再構築(当初考えていた文型が作れず、途中で他の文型で文を構成し直す) ○ 確認要求/理解の確認要求(言い方が合っているか、相手に伝わっているかを確認する) ○ 間接的アピール/直接的アピール(わからない表現を尋ねる) 許挺傑(2010)「日本語学習者の発話ストラテジーについての一考察 :第二言語習得環境にいる中上級学習者の縦断的データを用いて」『筑波応用言語学研究』17:111-124. 筑 波大学人文社会科学研究科 Færch, C. and Kasper, G. (1983). Plans and strategies in foreign language communication. In C.Færch and G.Kasper (Eds.) Strategies in Interlanguage Communication. Longman. 50
  • 51. © 1→10Robotics, Inc. All rights reserved. ロボットに見習ってほしいこと 人間は、言葉が不自由そうな相手に対しては 「確認」「質問」「繰り返し」を多用するので・・・ ● 「それって◯◯ってこと?」 と、ユーザーの発話の内容を言い換えて確認する →難しいとは思うのですが、できたらめちゃくちゃ賢く見えそう ●ユーザーからの確認、質問に答えられると会話がスムーズに感じられそう 51
  • 52. © 1→10Robotics, Inc. All rights reserved. まとめ:フォリナートーク ● フォリナートークとは、使用言語の異なる人どうしが話すとき(接触場面)、 母語話者が、非母語話者(外国人、foreigner)にわかりやすいように言い方を調整すること。 ● これに対して、非母語話者が取る方略のことを「コミュニケーション・ストラテジー」と 呼ぶこともある。 ● ユーザーはロボットにどの程度言葉が通じるのかわからないので、フォリナートークのような話し方になる 可能性がある。 ● フォリナートークの特徴 ○ ゆっくり、正しく、シンプルに、短く話す ○ 質問・確認・繰り返しを多用する→これに対応できたら賢そうに見える? 52
  • 53. © 1→10Robotics, Inc. All rights reserved. 53 「うーん・・・」って考えてるときは黙って聞い ててほしいな・・・
  • 54. © 1→10Robotics, Inc. All rights reserved. 考えてるときは黙って聞いててほしいな 54 「最近なにか気になった番組ってある?」 「番組?うーん・・・[えーっと・・・」 「 [ちょっと聞き取れなかった。どんな番組見たのー。」 「うーんとねえ・・・」 ※ [ は割り込みを表す ●たとえば以下のようなとき「考えてるからちょっと待って」となりました →「うーん」「えーっと」にも談話の中での機能がある
  • 55. © 1→10Robotics, Inc. All rights reserved. フィラーってなに? 会話の中で話し手が発する、「えーと」「あのー」「まー」などの発話。 ※「穴埋めことば」=fillers 55
  • 56. © 1→10Robotics, Inc. All rights reserved. フィラーってなに? ●日本語の品詞としては「間投詞」 56 これがフィラー <間投詞の分類> a. 対他的でない 1. 情動的感動詞: わあ、おお、まあ、げっ、ああ 2. 掛け声: よっこらしょっと、どっこいしょ b. 対他的 1. 挨拶・呼びかけ: おはよう、よっ、ねえ、おおい 2. 応答詞: はい、へえ、いいえ 3. いい淀み感動詞: あああ、ええ、ううん 森山卓郎(1996) 「情動的感動詞考」,『語文 (大阪大学国語国文学会)』,第 65 巻, 51–62.
  • 57. © 1→10Robotics, Inc. All rights reserved. フィラーの特徴 ●名詞や動詞のような概念的な意味(指示対象)を持たない ●話し手の態度などを表すことがある ○ 「え?今の私に言ったんですか?」→驚き、抗議、皮肉 ○ 「佐藤くんですか?まあー賢い男ですよ」→強め、皮肉 ●独立して文を構成でき、文頭や節の後などの場所に現れる ●語尾を伸ばす、終助詞がつくなど、いろいろな音声的バリエーションがある ○ あの / あのー / あのねー / あのーですねー 57 ということでですね、ま そういう うー あの 色んな経験をしながら あの うー 仕事をしております
  • 58. © 1→10Robotics, Inc. All rights reserved. フィラーの機能 ●聞き手に対する機能(他者指向的機能): →①ターン保持機能 ●話し手自身に対する機能(自己指向的機能): →②話し手が次の発言を考える間の時間稼ぎ ●テクスト構成に関わる機能: →③談話の区切り、換言や修正のマーカーとして機能 58
  • 59. © 1→10Robotics, Inc. All rights reserved. フィラーの機能 ①ターン保持機能 ●話し手がフィラーを発することで、話し手の発話が継続することが示され、話し手の ターン (発言権)が保持される。 Brown, Gillian (1977) Listening to spoken English, Essex: Longman. 水上悦雄・山下耕二 (2007) 「対話におけるフィラーの発話権保持機能の検証」,『認知科学』,第 14 巻,第 4 号,588–603 59 アノ 下の部分が アノー コー ナンテイウンデスカネ エート 「へ」ーみたいになってるんですよ アノひらがなの ↑この間4秒ぐらい聞き手は発言しないで待っている(ターンが保持される)
  • 60. © 1→10Robotics, Inc. All rights reserved. フィラーの機能 ①ターン保持機能 ●フィラーの最中は無闇に話しかけないことが暗黙のルールだが、助言・助け舟とし て聞き手による割り込みが認められることもある。 ※聞き手が助言できる立場で、話し手が聞き手からの助言を受けられる立場であることが双方で認識可能な状態であるときに、 フィラーに対する割り込みが適切となる。 串田秀也 (1999) 「助け船とお節介–会 話における参与とカテゴリー化に関する一考察」,好井裕明・山田富秋・西坂仰(編)『会話分析への招待』, 世界思想社,京都,124–147. 60 (BがAに図形の配置を説明している) A じゃ全体見たらどんな形? B (0.46)<ウーント 1.91(0.80) ナンヤ [ロー 0.42> A → [ティー とか B あ ティーじゃない A 凸とか Bがフィラーを続けて言い淀む Aが割り込んで助け舟を出す 水上悦雄・山下耕二 (2007) 「対話におけるフィラーの発話権保持機能の検証」,『認知科学』,第 14 巻,第 4 号,588–603
  • 61. © 1→10Robotics, Inc. All rights reserved. フィラーの機能 ②時間稼ぎ ●言いたい事を意図してから口に出すまでの心的プロセス(文の産出)の中で起こっ たなんらかのトラブルや遅れがフィラーとして音声に出る ○ 定延・田窪(1995: 76)によると、話し手は対話の際に、その対話に関係する情報を一時的に 取り出し、それを携えて対 話に臨むとする。定延・田窪 (1995) は話し手は自身 が持つ知識(定延・田窪 (1995) では「心的データベース」と呼ば れている)と対 話で利用される一時的な知識を分けるモデルを想定している。話し手は一時的 に取り出された情報 の中から検索したり、計算したり、さらに、取り出された 情報だけでは対話が続行できなくなった場合は知識全体から 情報を検索したり しながら対話を進めるというのが定延・田窪 (1995) の対話の考え方である。「あ の(ー)」や「ええ と」のようなフィラーは、検索や計算といった話し手の心的 な操作の実態が反映された形式であると考える。フィラーと は「自分のやって いる処理をモニタする標識」(田窪 1995: 1020) であり、従って話し手は「自分の心的計算上の困難 をモニタしながら音形式で表現」(田窪1995: 1023) しながら対話を進めている。 61 川田拓也(2010)「日本語フィラーの音声形式とその特徴について - 聞き手 とのインタラクションの程度を指標として -」博士論文、京都大学 定延利之・田窪行則(1995) 「談話における心的操作モニター機構 — 心的操作標識「ええと」と「あの(ー)」—」,『言語研究』,第 108 巻,74–93. 田窪行則 (1995) 「音声言語の言語学的モデルをめざして — 音声対話管理標識を中心に —」,『情報処理』,第 36 巻,第 11 号,1020–1026.
  • 62. © 1→10Robotics, Inc. All rights reserved. 主なフィラーとその役割 62 分類 代表的な フィラー 役割・特徴 例 「え」型 えー/えーと/ えっとねー えーと ● 計算処理中 ● 思考状態であることの表出 ● ひとりごとにも現れる ● 聞き手から視線をそらす傾向 「1234 足す 2345 は?」 「 ええと、3579」 (なくしたものを探している) 「えーと、あれどこやったかなあ 指示詞型 あのー/そのー /こう あのー ● 名前の検索 ● 発言内容に関する編集操作(話しかけると きなど) ● 聞き手の存在を予定する ● 比較的、聞き手から視線をそらさずに発話 される ビーナスじゃない方、あのー、セリーナ。 (席を 2 人分占拠している強面の乗客に対して) あのー、そこ空けてもらえるでしょうか? 「ま」型 まー/まあねー まあ ● スケールへの作用(多く見積もって…) →数字と共起しやすい ● 「けど」と共起して文全体の主張を弱めるこ とがある ● 聞き手から視線をそらす傾向 ● 話し手が聞き手に未知の情報を提供する 際に現れやすい 毎日五枚書くとして四百枚はマア三ヵ月ね。 おきみさんの相手は田中君と云って、無名の – まあ芸術家 である。 例えば東京球場の後に神宮球場とか後楽園球場とか色ん な野球場 ま一 東京ですけど近いところ行きました。 川田拓也(2010)「日本語フィラーの音声形式とその特徴について - 聞き手 とのインタラクションの程度を指標として -」博士論文、京都大学
  • 63. © 1→10Robotics, Inc. All rights reserved. 主なフィラーの頻度 ● 「国立国語研究所 話し言葉コーパス (CSJ)」(国立国語研究所 2004)の 対話資料データに出てくるフィラーの頻度(上位20種) ○ 上位20種で全体の96%を占める ○ 指示詞型(「あの/その」など) 全体の30% ○ 「ま」型(「まー」など) 全体の19% ○ 「え」型(「えー」など) 全体の18% ● 独話(講演など)のデータでは傾向が異なる: 「え」型33%、指示詞型23%、「ま」型18% 63 川田拓也(2010)「日本語フィラーの音声形式とその特徴について - 聞き手 とのインタラクションの程度を指標として -」博士論文、京 都大学
  • 64. © 1→10Robotics, Inc. All rights reserved. ロボットに見習ってほしいこと ●ユーザーが発するフィラーを識別してほしい ○ ただ、フィラーは種類がたくさんあり、あいづちや指示表現と語形が共通しているものも多いため、区 別が難しい。 ○ とはいえ、頻度に大きな偏りがあり、上位20種類で96%をカバーできる。 ●フィラーにはターン保持機能がある →フィラーが出たらユーザーが次の発話をするまで話さずに待ってほしい 64 最近何か気になった番組ってある? 番組?うーん・・・ うんうん ・・・番組? フィラー 待つ
  • 65. © 1→10Robotics, Inc. All rights reserved. ロボットに見習ってほしいこと ●人間はフィラーを発するときに視線をそらすことがある ●フィラーを続けたり長く伸ばすときは答えに窮していることがある →このような場合には、直前のロボットの発言を補足するような 割り込みをしてもいいかも? ○ ロボットが発話している間もユーザーの発話を聞いていないといけなくなってしまうかもですが・・・ 65 最近何か気になった番組ってある? 番組?うーん・・・えーっとねえー・・・んーなんだろう・・・ なんか、バラエティーとかは? 長い言い淀み 「番組」の補足
  • 66. © 1→10Robotics, Inc. All rights reserved. まとめ:フィラーの機能 ● フィラーとは、「えーと」「あのー」「まー」などの「穴埋め言葉」。 ● フィラーの機能 ①ターン保持機能(ただし、助け舟の割り込みは許される) ②話し手が次の発言を考える間の時間稼ぎ ③談話の区切り、換言や修正のマーカーとして機能 ● 主なフィラーとその特徴 ○ えーと:計算処理、話し手指向、聞き手から視線をそらす傾向 ○ あのー:名前の検索、話す内容への編集、聞き手指向、比較的視線をそらさない ○ まー:数字/程度、新情報、視線をそらす傾向 ● フィラーは膨大な種類があるが、頻度には偏りがあり、上位20種で96%。 66
  • 67. © 1→10Robotics, Inc. All rights reserved. 詳しくは ● 川口由起子「グライス理論における協調原理と格率一般との論理的関係」『科学哲学』34、2001年 https://www.jstage.jst.go.jp/article/jpssj1968/34/2/34_2_101/_pdf ● グライスの協調の原則(cooperative principle)ー日本語教師のページ http://www.nihongokyoshi.co.jp/manbow/manbow.php?id=190 ● 有光奈美「グライスの格率への違反と笑い」2010年、東洋大学人間科学総合研究所紀要 第 12 号 61-75 https://www.toyo.ac.jp/uploaded/attachment/865.pdf ● 栁田 直美(2013)「接触場面における母語話者のコミュニケーション方 略研究 : 情報やりとり方略の学習に着目して」 http://hdl.handle.net/2241/00124440 ● 川田拓也「日本語フィラーの音声形式とその特徴について - 聞き手とのインタラクションの程度を指標として -」 2010年、博士論文 https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/120939/3/D_Kawada_Takuya.pdf 67
  • 68. © 1→10Robotics, Inc. All rights reserved. ご清聴、ありがとうございました! (この後、質疑応答は盛り上がりました) 68
  • 69. © 1→10Robotics, Inc. All rights reserved. ワントゥーテンロボティクスは、「人とロボットとが、やさしさでつながり合う未来を切り拓く。」をビジョンに、 誰もが夢に描くようなロボット体験を実現するため、挑戦を続けています。 エクスペリエンスディレクター、ライター、演出家、アプリエンジニア、サーバーサイドエンジニア、機械学習エンジニア、ハードウェアエ ンジニア、言語学専門家。さまざまな技能を有する仲間がそれぞれのアプローチで、日々試行錯誤を重ねています。 お仕事のご依頼や、採用へのご応募など、興味がお持ちの方はウェブサイトよりお問い合わせください。 http://1-10robotics.com 69