転載・引用について

ユーザ用ツール

サイト用ツール


tweet:2017:0425_01

Translator

何を血迷ったか、翻訳エンジンについてちょっとだけ調べてみたので、メモを。

かるーく(ゆるーく)調べた(ぐぐった)ところ、

  • 英単語の平均文字数は 4.5文字とか5.1文字くらいらしい。まぁ、5文字と考えておけばいいか
  • 英語1文章に含まれる単語数は、まぁ、色々違うらしい。
    • カジュアルな文章で20単語位
    • 一般的な文章で25単語位
    • 新聞で20単語位
    • 子供向け絵本で5単語位

ものすごく単純に RFC文書における単語数を数えて平均を取ってみると、52645文字、6718 単語と言われる。(7.836文字/単語) この数値は、単純にwcで見ただけなので、実際にはHeaderやFooter、Indexなどがある。 ちゃんと調べるのは単純に面倒なので、大雑把に考えて、平均で6500単語、8文字/単語くらいと近似できると 思う ので、1 RFCあたり5.5万文字と見ればそんなに外さないと思われる。

ちょっと面白かったのは、Plain English 読みやすさの指標(FKR/FKG/GFS)って一体何が基準なの!?の記事。 軽く眺めておくといいかも。

Google様で 翻訳 API で検索してみる

    • 原則有料。
    • 言語検出および翻訳に関しては 1万文字/$20
      • RFCで考えると、5.5万/1万*20 = $120 として、$1=¥110とすれば、¥13,200位か。
    • google翻訳知らない人は google translateでぐぐれ
    • 個人利用と法人利用(ビジネス利用)がある
    • サービスとしても提供されている
    • 200万字まで無料。(文字数であり、単語数ではない)
      • RFCで考えてみると200万/5.5万≒36 だから、36本翻訳できる計算になる。
        • 個人の普段使いだと思えば十分だが、プロの翻訳者では少ないというあたりなんだろうな。
    • それ以降は段階的に料金が上がる。値段表が出るページ

実質で使える翻訳APIはMSとGoogleしかなさそうだが、翻訳精度がよほど高くない限りGoogleは使えないなぁ。 MSの翻訳エンジン、textで流し込むぶんには結構いい翻訳精度だったし。

ただ、どちらの翻訳エンジンも文脈は解釈しない(できない)から、どうしたって人様が手をかけてやる必要は(いまのところ)ある。

このウェブサイトはクッキーを使用しています。 Webサイトを使用することで、あなたはあなたのコンピュータにクッキーを保存することに同意します。 また、あなたはあなたが私たちのプライバシーポリシーを読んで理解したことを認めます。 同意しない場合はウェブサイトを離れてください。クッキーに関する詳細情報
tweet/2017/0425_01.txt · 最終更新: 2017/04/25 12:37 by 127.0.0.1

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki