最近、ちょっと笑ってしまう出来事がありました。
ある日本人がAIに私のベトナム語を分析させて、こう結論づけたのです。
「あなた、本当はベトナム人じゃないでしょう。」
理由は、「文章がネイティブっぽくない」というAIの結果。
でも、そんな単純に判断できるほどベトナム語は甘くありません。
むしろ、ベトナム語はAIがつまずきやすい言語なのです。
1. 多義語だらけのベトナム語
ベトナム語には、一つの単語に複数の意味があるものが多く、文脈で判断しなければなりません。
例:bận
- 忙しい(例:Em bận gì không?=今忙しいですか?)
- 服を着る(例:Em không bận=忙しくない…だけでなく、茶化せば「何も着ていない」)
文脈がなければ、意味を間違えるのはAIだけでなく人間にも起こり得ます。
2. 句読点ひとつで意味が逆転
Trâu cày không được thịt と Trâu cày không được, thịt。
発音はほぼ同じですが意味は正反対です。
- 前者:耕作に使える水牛は殺してはいけない。
- 後者:耕作に使えない水牛は殺して肉にする。
ある村では、区長が「殺すな」の意味で言ったのに、村長が「殺せ」と解釈し、牛は結局食卓に…。
AIがこのニュアンスを区別するのは、ほぼ不可能です。
3. スラング・隠語・言い換え
+mát:
- 涼しい
- 少し頭がおかしい(スラング)
+ngủ:
- 寝る
- 性的な意味での「寝る」
+ăn:
- 食べる
- ズルをする
+bận:
- 忙しい
- 服を着る
“Mát nhỉ?”(涼しいね?)は、文脈次第で「ちょっと(頭が)おかしいんじゃない?」にもなります。
4. 丁寧語が皮肉になる──「mời」
mời は本来「招く/誘う」という意味です。
- Mời anh uống nước → お茶をどうぞ。
- Mời em ngồi → 座ってください。
しかし、例えば Mời anh về cho は直訳すれば「お帰りください」ですが、実際のニュアンスは「帰ってくれ」に近く、状況によっては丁寧な追い出しになります。
AIは「mời=招く」とだけ覚えているので、この使い分けを理解できません。
5. なぜAIはベトナム語に弱いのか
理由は二つあります。
① ベトナム語そのものが難しい
多義語、声調、文脈依存、隠語、言葉遊び──意味が状況によって変わりやすく、解釈の幅が広い。
② 話者人口が少ないため、学習優先度が低い
英語や中国語、日本語と比べると話者は約1億人。
AI開発企業は学習データの優先度をどうしても低くせざるを得ません。
結論
AIは便利な道具ですが、まだベトナム語のネイティブ感覚──
「この場面でどう言えば、どう受け取られるか」
──を再現できません。
ですから、現時点ではこう断言できます。
AIはまだベトナム人にベトナム語で勝てない。
もしAIが「この人はベトナム人ではない」と判定しても、それはただの推測。
本当のネイティブ感覚は、毎日その言葉で笑い、怒り、冗談を言い合っている人間だけが持っているのです。