【リリース】タイ語翻訳AIカメラ for LINEBOT(2/4)
サービス開発の背景
なぜタイ語の翻訳なのか?
開発者である私のアナザースカイが、そう
「Thailand」なのです。(最近タイに親戚ができました)
タイという国は不思議な魅力のある国で、タイ旅行に行ったほとんどの人が、タイ好きになって帰国します。
タイ好きになった日本人は、日本でもタイの面影を探すようになります。
私もその一人。
タイ料理やタイマッサージなどを見つけては、ひとりニンマリしてみたり。
そして、タイに行って印象深い事のひとつが、
丸っこくてクネクネした可愛らしいタイ文字。
とにかく読めない。でも、何とかして読みたい。
外国人観光客が多いところでは、英語も併記されているので意味がわかることが多いのですが、少しローカルな所に足を運ぶと、タイ語しか書いていないことも当然あります。
そこで
「写真からタイ語を翻訳するアプリ」を探していたのですが、その当時はGoogle翻訳アプリ、Microsoft翻訳アプリでも、タイ語のOCR機能が非対応となっていました。
それなら作るしかないよな、と考えたのが開発のきっかけです。
(現在はようやく、Google翻訳アプリでタイ語のOCR機能がサポートされたようです。)
現地で撮った写真でお試し!
<ケース1>
まずは、タイ現地で「タイ語翻訳AIカメラ」が一番役に立った場面から。
とある田舎のホテルの壁にあるスイッチ。どっちがどっちだ?
文字認識位置 |
|
タイ語 |
|
น้ำอุ่น
แอร์ -
|
音訳 |
|
namun
ae -
|
日本語訳 Microsoft |
|
温水
空気
|
日本語訳 Google |
|
温水
エアコン
|
なるほど。左が「シャワーの温水器のスイッチ」、右が「エアコンのスイッチ」のようですね!
Microsoft翻訳が「空気」と直訳っぽくなっているのに対して、Google翻訳は「エアコン」と適切な翻訳になっています。
文字認識で「แอร์ -」の『-』と読み取られた部分は、光の映り込みが読み取られた模様。
こうしたノイズが入り込むのは仕方なしか。
<ケース2>
タイ語には、省略してシンプルに書かれたタイ文字フォントが存在します。
あれ?辞書に載っているタイ文字と違う!と戸惑うことも多いのですが、この「省略して書かれたタイ文字」を読み取ることはできるでしょうか?
文字認識位置 |
|
タイ語 |
|
ศูนย์บริการ
|
音訳 |
|
sunborikan
|
日本語訳 Microsoft |
|
サービス センター
|
日本語訳 Google |
|
サービスセンター
|
お見事!ちゃんと読み取れています。
アルファベットの「u」や「s」にしか見えない文字もあるのですが、正しくタイ文字として認識してますね。
文字認識位置 |
|
タイ語 |
|
ขนมปังไส้คัสตาร์ดวานิลลา
|
音訳 |
|
khanompangsaikhattadawaninla
|
日本語訳 Microsoft |
|
カスタードバニラパン
|
日本語訳 Google |
|
バニラカスタードパン
|
お店にある商品にも、省略文字がよく使われています。
音訳を見てみるとわかるのですが、パンはタイ語で「khanompang(カノ厶パン)」と呼びます。可愛らしい響き!
カノムは「お菓子」の意味なので菓子パンのことかと思いきや、食パンのような甘くないパンもカノ厶パンです。(余談でした)
<ケース3>
地方にあるカフェのメニュー。
困ったな。日本人の私には「HOT」しか読み取れない。。。
カメラで翻訳してみると、左下に衝撃のメニューが!
文字認識位置 |
|
タイ語 |
|
อิตาเลี่ยนโซดา
บลูฮาวาย 25.-
น้ำกีวี่
น้ำสตรอเบอรี่ 25.-
น้ำลิ้นจี่
น้ำป่วยเปรี้ยว
น้ำมะนาว - 25.-
|
音訳 |
|
italiansoda
baluhawai 25.-
namkiwi
namsotroboeri 25.-
namlinchi
nampuaipriao
nammanao - 25.-
|
日本語訳 Microsoft |
|
イタリアンソーダ
ブルーハワイ 25. -
キウイウォーター
ストロベリージュース 25.-
ライチジュース
酸っぱい病気の水
ライムジュース-25.-
|
日本語訳 Google |
|
イタリアンソーダ
ブルーハワイ25.-
キウイジュース
イチゴジュース25.-
ライチジュース
酸っぱい水
レモン汁-25.-
|
酸っぱい病気の水?!嫌だ!ぜったい飲みたくない!!
タイ人に見てもらったところ、「น้ำบ๊วย」(梅ジュース)が「น้ำป่วย」(病気の水)になってしまっているようです。
一文字間違うだけで、大変なことになりますね。
日本語でいうと、「すっぱい」と「おっぱい」くらい違います。(例えはこれでOK?)
<ケース4>
単語だけでなく、文章になっている場合の翻訳はどうでしょう?
文章の意味がわかると、だいぶ助かる!
文字認識位置 |
|
タイ語 |
|
ห้ามจับ
เสาปูนปั้นปิดทองแตกหักง่าย
|
音訳 |
|
hamchap
saopunpanpitthongtaekhakngai
|
日本語訳 Microsoft |
|
キャプチャしない
割れやすいスタッコボラード
|
日本語訳 Google |
|
触らないで
漆喰の柱、金メッキ、簡単に壊れます
|
Google翻訳のほうが、圧倒的にわかりやすい日本語になりました。
Microsoft翻訳は、文章訳が少し苦手と言えるかもしれませんね。