【リリース】タイ語翻訳AIカメラ for LINEBOT(2/4)

サービス開発の背景

なぜタイ語の翻訳なのか?
開発者である私のアナザースカイが、そう「Thailand」なのです。(最近タイに親戚ができました)


タイという国は不思議な魅力のある国で、タイ旅行に行ったほとんどの人が、タイ好きになって帰国します。
タイ好きになった日本人は、日本でもタイの面影を探すようになります。
私もその一人。
タイ料理やタイマッサージなどを見つけては、ひとりニンマリしてみたり。

そして、タイに行って印象深い事のひとつが、丸っこくてクネクネした可愛らしいタイ文字
とにかく読めない。でも、何とかして読みたい。
外国人観光客が多いところでは、英語も併記されているので意味がわかることが多いのですが、少しローカルな所に足を運ぶと、タイ語しか書いていないことも当然あります。

味のあるタイ語の看板(サビ萌え)

そこで「写真からタイ語を翻訳するアプリ」を探していたのですが、その当時はGoogle翻訳アプリ、Microsoft翻訳アプリでも、タイ語のOCR機能が非対応となっていました。
それなら作るしかないよな、と考えたのが開発のきっかけです。
(現在はようやく、Google翻訳アプリでタイ語のOCR機能がサポートされたようです。)

現地で撮った写真でお試し!

<ケース1>

まずは、タイ現地で「タイ語翻訳AIカメラ」が一番役に立った場面から。
とある田舎のホテルの壁にあるスイッチ。どっちがどっちだ?
ホテルのスイッチ(バンコクではない)
文字認識位置
タイ語
น้ำอุ่น
แอร์ -
音訳
namun
ae -
日本語訳 Microsoft
温水
空気
日本語訳 Google
温水
エアコン
なるほど。左が「シャワーの温水器のスイッチ」、右が「エアコンのスイッチ」のようですね!
Microsoft翻訳が「空気」と直訳っぽくなっているのに対して、Google翻訳は「エアコン」と適切な翻訳になっています。
文字認識で「แอร์ -」の『-』と読み取られた部分は、光の映り込みが読み取られた模様。
こうしたノイズが入り込むのは仕方なしか。

<ケース2>

タイ語には、省略してシンプルに書かれたタイ文字フォントが存在します。
あれ?辞書に載っているタイ文字と違う!と戸惑うことも多いのですが、この「省略して書かれたタイ文字」を読み取ることはできるでしょうか?
バイク屋さんの看板
文字認識位置
タイ語
ศูนย์บริการ
音訳
sunborikan
日本語訳 Microsoft
サービス センター
日本語訳 Google
サービスセンター
お見事!ちゃんと読み取れています。
アルファベットの「u」や「s」にしか見えない文字もあるのですが、正しくタイ文字として認識してますね。


セブンのパン
文字認識位置
タイ語
ขนมปังไส้คัสตาร์ดวานิลลา
音訳
khanompangsaikhattadawaninla
日本語訳 Microsoft
カスタードバニラパン
日本語訳 Google
バニラカスタードパン
お店にある商品にも、省略文字がよく使われています。
音訳を見てみるとわかるのですが、パンはタイ語で「khanompang(カノ厶パン)」と呼びます。可愛らしい響き!
カノムは「お菓子」の意味なので菓子パンのことかと思いきや、食パンのような甘くないパンもカノ厶パンです。(余談でした)

<ケース3>

地方にあるカフェのメニュー。
困ったな。日本人の私には「HOT」しか読み取れない。。。
カメラで翻訳してみると、左下に衝撃のメニューが!
カフェのメニュー(左下に注目)

文字認識位置
タイ語
อิตาเลี่ยนโซดา
บลูฮาวาย 25.-
น้ำกีวี่
น้ำสตรอเบอรี่ 25.-
น้ำลิ้นจี่
น้ำป่วยเปรี้ยว
น้ำมะนาว - 25.-
音訳
italiansoda
baluhawai 25.-
namkiwi
namsotroboeri 25.-
namlinchi
nampuaipriao
nammanao - 25.-
日本語訳 Microsoft
イタリアンソーダ
ブルーハワイ 25. -
キウイウォーター
ストロベリージュース 25.-
ライチジュース
酸っぱい病気の水
ライムジュース-25.-
日本語訳 Google
イタリアンソーダ
ブルーハワイ25.-
キウイジュース
イチゴジュース25.-
ライチジュース
酸っぱい水
レモン汁-25.-
酸っぱい病気の水?!嫌だ!ぜったい飲みたくない!!
タイ人に見てもらったところ、「น้ำบ๊วย」(梅ジュース)が「น้ำป่วย」(病気の水)になってしまっているようです。
一文字間違うだけで、大変なことになりますね。
日本語でいうと、「すっぱい」と「おっぱい」くらい違います。(例えはこれでOK?)

<ケース4>

単語だけでなく、文章になっている場合の翻訳はどうでしょう?
文章の意味がわかると、だいぶ助かる!
Do Not Touchな看板(他に何が書かれてる?)
文字認識位置
タイ語
ห้ามจับ
เสาปูนปั้นปิดทองแตกหักง่าย
音訳
hamchap
saopunpanpitthongtaekhakngai
日本語訳 Microsoft
キャプチャしない
割れやすいスタッコボラード
日本語訳 Google
触らないで
漆喰の柱、金メッキ、簡単に壊れます
Google翻訳のほうが、圧倒的にわかりやすい日本語になりました。
Microsoft翻訳は、文章訳が少し苦手と言えるかもしれませんね。

あなたへのおすすめ記事