tweet:2017:0425_01
Translator
何を血迷ったか、翻訳エンジンについてちょっとだけ調べてみたので、メモを。
かるーく(ゆるーく)調べた(ぐぐった)ところ、
- 英単語の平均文字数は 4.5文字とか5.1文字くらいらしい。まぁ、5文字と考えておけばいいか
- 英語1文章に含まれる単語数は、まぁ、色々違うらしい。
- カジュアルな文章で20単語位
- 一般的な文章で25単語位
- 新聞で20単語位
- 子供向け絵本で5単語位
ものすごく単純に RFC文書における単語数を数えて平均を取ってみると、52645文字、6718 単語と言われる。(7.836文字/単語) この数値は、単純にwcで見ただけなので、実際にはHeaderやFooter、Indexなどがある。 ちゃんと調べるのは単純に面倒なので、大雑把に考えて、平均で6500単語、8文字/単語くらいと近似できると 思う ので、1 RFCあたり5.5万文字と見ればそんなに外さないと思われる。
ちょっと面白かったのは、Plain English 読みやすさの指標(FKR/FKG/GFS)って一体何が基準なの!?の記事。 軽く眺めておくといいかも。
Google様で 翻訳
API
で検索してみる
-
- 原則有料。
- 言語検出および翻訳に関しては 1万文字/$20
- RFCで考えると、
5.5万/1万*20 = $120
として、$1=¥110とすれば、¥13,200位か。
- google翻訳知らない人は
google
translate
でぐぐれ
-
- 個人利用と法人利用(ビジネス利用)がある
- サービスとしても提供されている
- 200万字まで無料。(文字数であり、単語数ではない)
- RFCで考えてみると
200万/5.5万≒36
だから、36本翻訳できる計算になる。- 個人の普段使いだと思えば十分だが、プロの翻訳者では少ないというあたりなんだろうな。
- それ以降は段階的に料金が上がる。値段表が出るページ
実質で使える翻訳APIはMSとGoogleしかなさそうだが、翻訳精度がよほど高くない限りGoogleは使えないなぁ。 MSの翻訳エンジン、textで流し込むぶんには結構いい翻訳精度だったし。
ただ、どちらの翻訳エンジンも文脈は解釈しない(できない)から、どうしたって人様が手をかけてやる必要は(いまのところ)ある。
tweet/2017/0425_01.txt · 最終更新: 2017/04/25 12:37 by 127.0.0.1