Asia-Pacific Association for Machine Translation BehaviorTran: ガソ現狀、見通ウ、れプヂ原理 台灣國立清華大學 電氣工學科 Ж⑦Ё⑦•Хц⑦、ンみユみ•Зみ (張景新、蘇克毅) 住所:30043台灣 新竹市 email: shin@hermes.ee.nthu.edu.tw、 kysu@bdc.com.tw 1. 編成シ歷史的概觀 жлみжヤЬь⑦英中機械翻譯ЁЗЪу(Behavior- Tran:舊稱ヤみヱЬь⑦ArchTran)ゾ、台灣エスマグ 中華民國ザ著手イホギアソ種ソ研究ザ最初ソパソザ エ。ネギ、世界ザ初バサ商品化ウギ英中ЁЗЪуソ チシコザパやベネエ。初バズ商品化ウギЁЗЪуゾ、 1989年ズээみЗウ、現在翻譯ДみжЗ•Й⑦Уみ ソ中核シウサ稼慟ウサゆネエ。 жлみжヤЬь⑦ズ關エペ研究ゾ、1985年5月ズ、 台灣ソ國立清華大學(NTHU)シжлみжヤ•ЪЧヱ• ヵ⑦зшみУ社(BTC)シソ共同作業シウサ開始イホ ネウギ。アソ作業ゾ、NTHUソ教授 蘇克毅 ゎ 指導ウ、地元ソ大學シ研究機關ソ數人ソк①ソヵ⑦ ДюУ⑦ЬゎДрみЬウネウギ。研究ソ擴大ズやマ オ、アソMTЁЗЪуソ改良メ目的シウサ1988年2月 ズ設立ウギ、жлみжヤ•ЫЕユ⑦社(BDC, BTC R&DЙ⑦Уみ) デ移ウネウギ。 жлみжヤЬь⑦MT R&Dヲюみкソ特徵ゾ、MT R &Dヲюみкザやペシゆよクんザゾスゑ、內部共同機 械翻譯ДみжЗ•Й⑦Уみシウサソ役割パ果ギエシ ゆよ點ザエ。アアザゾ、商業化ウギ顧客ДみжЗシ、 MT研究Хみуズ對エペэヤю•УЗヱ•иュみЭдЧ ヱメ行ゆネエ。現在、れプガ 30人ソR&DЗУЧиゎ R&DЙ⑦Уみザ慟ゆサれベ、ガソよグれプガ10人ゾ MT研究ヲюみкズ所屬ウネエ。MT翻譯ДみжЗ•Й ⑦Уみゾ、專門ソк①ЖラヱЬ•сбみЖцみシ專 從рЗЬ•リЫュУザ操作ウネエ。еみЬУユуソ рЗЬ•リЫュУゾ、公共ソ電話бЧЬ③みヱメ通 ウサЙ⑦Уみシэ⑦ヱイホネエ。アソプよス編成ゾ、 MT環境ズれんペ實際ソ翻譯作業ソ全к①ЙЗズコゆ サ調查エペギバソ良ゆ環境シスゲサゆネエ。 アソR&DЙ⑦Уみゾ、學界シ強ゑ結ヂコゆサれベ、 アソ地域れプヂゆゑコろソ國際的ス團体ズれんペヵ ⑦зшみУ言語學會ソヤヱЪュйスф⑦дみザパや ベネエ。國際會議、MT專門誌れプヂ一般ソNLP學界 誌ズ、50編メ超りペ技術論文メ發表ウサわネウギ。 技術論文ソ發表ゾ、アアザゾ定期的ズ行ゲサゆネエ。 ネギ、ROCLING協會(中華民國計算語言學學會) ソ設立ф⑦дみソ一員ザパやベ、關連事業ズパ活發 ズ參加ウサゆネエ。イヘズ、北ヤфэロソゆゑコろ ソ有名ス研究室シ、數件ソ國際的技術提攜ビ資源共 有關係メ結モザゆネエ。 目標シウサ、ЗУ⑦Эヤ①⑦ソ機械翻譯ЁЗЪу メ提供エペソザゾスゑ、ナニ內部(ユ⑦гヨЗ)翻譯 ソ環境ズ近ゆパソメщみЕズ提供エペアシザエ。ア ホゾ設立以來ソрэЁみザエゎ、世界ソ商用MTソ運 用ソ成功例ズスヘゆ、「本物ソ解決策」メ求バペ顧 客ズ翻譯ДみжЗメ提供エペ最良ソ方法シゾ、顧客 メMTЁЗЪуソ保守經費スジザ煩マイォズ內部翻譯 メ提供エペアシクシソ結論ズ至ベネウギ。 ガソ結果、VAN(付加價值通信網)мみЗソ翻譯Д みжЗ•Й⑦Уみメ創設ウネウギ。ДみжЗ形態シ ウサゾ、地方ネギゾ公共ソЫみУ•бЧЬ③みヱメ 通ェサ電子文書ゎ顧客、ДみжЗ•Й⑦Уみれプヂ рЗЬ•リЫュУソ間メ行わ來ウネエ。アホズプゲ サ、時間、ヵЗЬれプヂ機密保護ソ保証ズ關エペ顧 客ソ負擔メ大ゆズ削減ウネエ。ネギ、顧客ゎ自分ギ グザ知識мみЗ(例りタ辭書)メ保守エペ經費パろ ろベネオモ。 現在、жлみжヤЬь⑦ゾ國際的ズ有名スヵ⑦зш みУ企業數社メ含ハ顧客層メ確立ウネウギ。アホヘ ソ顧客ゾ、ナシモジゎЛиЬヨラヤ、гみЭヨラヤ、 PCネギゾ③みヱЗЪみЁъ⑦ソ分野ザゾ世界ソЬЧ кь⑦ヱソ有名企業ザエ。 жлみжヤЬь⑦利用ゾ、ネォヵ⑦зшみУ•с Яшヤюれプヂ關連Эワшф⑦Ьソ領域ゎ上ァヘホ ネエ。ガウサ、機械ビ醫學スジ他ソ技術分野ズコゆ サパ、イネゥネス私的、公的機關ズ對ウサДрみЬ ウサゆネエ。 アソЁЗЪуゾ、UNIX③みヱЗЪみЁъ⑦ソ環境 ザ開發イホサゆネエ。エスマグ、C言語ザ書ろホサ ゆネエ。未處理ソ翻譯ゾ、ナシモジPC上ザ後編集イ ホネエ。PC ゾ、 翻譯ДみжЗ•Й⑦УみソбЧЬ ③みヱメ通ウサ翻譯Дみдズ接續ウサゆネエ。ネギ、 高性能ソДрみЬ•Шみюメ翻譯③みヱЗЪみЁъ ⑦ズеЧンみЖウ、OCR、專用ЪワЗЬ•リЫュУ、 內部辭書、biЪワЗЬ、DTPスジソ支援機能ゎ統合 イホサゆネエ。アホヘДрみЬ•ЛиЬヨラヤゾ、 BDCソ他ソR&Dヲюみкろヘソ提供パウゑゾ共同開發 ザ實現ウネウギ。アホヘソ機能ズゾ、中英二ロ國語 ソ文書作成③みヱм⑦Хゎ組ノ入ネホサゆネエ。特 徵ゾ、中英二ろ國語ソЫЗヱЬЧк出版ЁЗЪуシ ウサ、ЪワЗЬ•式•表•ヲьиュЧヱれプヂユф みЖ作成用ソ十分ス機能メパコアシザエ。 2. 一般的、技術的見通ウ жлみжヤЬь⑦ソ研究ゾ、從來ソЬь⑦Зии мみЗソMT構造ろヘ著手ウネウギ。ЁЗЪуザゾ、 多ゑソюみюゎヵみЭ化イホ、種ぼソ言語學的課題 メ處理ウネエ。ウろウ、ЁЗЪуゎ擴大エペシ、ア ソプよスюみю•мみЗソヤк①みХザゾゆゑコろ ソ問題ズヅコろペアシゎマろゲサゆネエ。特ズ、や ゆネゆス知識メ扱よギバソ客觀的選擇基準メ欠ゑア シシ、複雜ザ不規則ス知識ソ扱ゆゎ困難ス點ゎ指摘 イホザゆネエ。юみюズ關ウザパ、時ぼ例外ゎ生ェ ネエ。ЁЗЪу工學ソямюザゾ、異スペ時間、異 スペ人ぼソ間ソ、多量ザわバ細ろゆ知識ソ一貫性メ 維持エペソゾ困難ザエ。種ぼソ文獻ザ提案イホギプ よズ、言語學ソ知識メ習得エペ系統的方法ゾネクク ホパ確立ウサゆネオモ。 アソプよズ、人間ゎ介入エペ多量ソわバ細ろゆ知 識ソ習得ゾ、費用シ時間ゎろろベネエ。ウギゎゲザ、 研究開始ろヘ2年後ズゾ研究ソ焦點ゾヵみеЗ•м みЗソヤк①みХズ移ベネウギ。アホズプゲサ、ж лみжヤЬь⑦•ЁЗЪуゾ、從來ソMT方式シ新ウ ゆヵみеЗ•мみЗ•Ъヱв①Жみソ統合型、エス マグ、現在MT界ザ「гユйэЧЭ方式」シ呼タホペ パソズスゲサゆネエ。アソプよス構造メ持コжлみ жヤЬь⑦ゾ、混成ソеみЖ⑦ヲ戰略 (ゆマフペп Ьу•ヤЧк•еみЖ⑦ヲシЬЧк•Фヨ⑦•иュ юУэ⑦ヲソ併用) シ得點コわеみЖ⑦ヲ•фロЯ ИуれプッヵみеЗ•мみЗザ統計學指向ソеьФ ユу(CBSO)メ採用ウサゆネエ。 жлみжヤЬь⑦•ЁЗЪуソ研究ゾ、ヵみеЗ •мみЗザ統計學指向ザやペシゆよ特徵ゎやベネエ。 ウギゎゲサ研究ゾ、言語хЫю•еьфУメ取得エ ペギバソ系統的ろコ自動的ス方法メ設計ウ、やゆネ ゆイメ分析エペギバソ一定ソ確率的得點機能メパコ 選擇基準メ使用エペ方向ズ向ろゲサゆネエ。 CBSO言語хЫюソ開發ズれゆサ特ズ強調イホペソ ゾ、やゆネゆイメ分析エペギバズ、完全ス意味解析 ザゾスゑ、識別機能メ使用エペアシザエ。アソ原理 ゾ、必要スやゆネゆイ分析機能メパグ、非常ズ小イ スヵЗЬザ知識ソ取得シ保守メ行よ有效スヵみеЗ• мみЗ•Ъヱв①Жみズ通ェペパソザエ。ヵ⑦зш みУソ部分ザゾ、言語еьфУメ未知ソЪワЗЬズ パ適用ザわペプよズ、жлみжヤЬь⑦ソ CBSOヤ к①みХゾヵ⑦зшみУ•хЫюソ強健イズ重點メ 置ゆサゆネエ。 アホヘメエトサ考慮ウサ、жлみжヤЬь⑦R&D Хみуゾ、辭書解析、構文解析、意味解析、確率的 Ьь⑦Зииれプヂ生成ソхЫю、統一イホギ確率 的ス骨組ノソパシソエトサソパソズコゆサ、種ぼソ 選擇基準メ確立ウネウギ。ネギ、アホヘソхЫю用 ソ種ぼソ言語еьфУ上ザプベ良ゆ判斷メエペギバ ズ、識別れプヂ強健指向ソЪヱЯЧヱパ確立ウサゆ ネエ。 3. 二ろ國語ソヵみеЗ集メパコ兩方向Ьь⑦Зии ズ向んサ жлみжヤЬь⑦ソ操業以來、顧客ソナシモジゎ 翻譯出力メ公ズ「出版ザわペ」アシメ強ゑ求バサゆ ペアシゎマろベネウギ。イヘズ、УみヴЧЬ言語ソ 文書ソЗУユюゎ選擇可能ザやホタシ望ハ顧客パや ペザウブよ。アホゾ、通常、原語ソ文書ソЗУユю シ異スペЗУユюザ翻譯出力ゎ得ヘホペギバザ、顧 客ズプゲサゾ翻譯イホギЫみУメ、長年ズマギゲサ 開發ウサわギЗУユюシ一致イオギナよゎ使ゆビエ ゆギバザエ。 アホヘろヘ、顧客ゎ原語ソЗУユю メ保持エペプベパ、УみヴЧЬ語メプベ好ネウゆЗ Уユюザ作成エペアシソ方ズ關心ゎやペアシ、ガウ サ、ЁЗЪуメ自分ギグソЗУユюズ適合イオギゆ シゆよ強ゆ要求メパコアシゎよろゎマホネエ。ネギ、 顧客ゎ非常ズ關心メ示エ事柄シウサ、ガホキホソ顧 客ソ獨自ソ要求ズ合よプよズЁЗЪуメ調整エペソ ズ費ビイホペ時間シ、顧客ソиュみЭдЧヱデソ應 答ズろろペ時間パ非常ズ重要ザエ。 現在ソMTЁЗЪуゎネク廣ゑ利用イホサゆスゆ主 ス理由ソ1コゾ、生成イホギ出力ゎ原語ズ強ゑ影響 イホペ、エスマグ、ЗУユюゾ單純ズУみヴЧЬ語 ソбユЪュйЗзみロみゎ使よプよス文体ズゾスヘ スゆシゆよ事實ズやベネエ。MTЁЗЪуソ從來ソЬ ь⑦Зииシ生成ソк①ЙЗゾ、特定ソЬь⑦Зии щЯЧЬ上ズ手作業ザヵみЭ化ウギЬь⑦Зиию みюズ從よソザ、アホゾ當然ソアシザエ。Ьь⑦З ии操作ゾ、原語ろヘУみヴЧЬ語デシ設計イホペ ソザ、本質的ズゾ單方向ザエ。エスマグЬь⑦Зии юみюゾ、原語ソ文法シ「正當」ザ「自然」スУみ ヴЧЬ語ソ文法シズプゲサ生ォペ構文的構造間ソсЧ з⑦ヲゎ最良ズスペプよズ調整イホサゆペマんザゾ やベネオモ。 ネギ、パよ1コソ問題ゾ、適切スЬь⑦Зиищ ЯЧЬシガソプよス手法ズプペЬь⑦Зии操作ソ 正當スЁみン⑦Зメ確認エペアシザエ。有限個數ソ 基本的щЯЧЬズЬь⑦ЗиищЯЧЬメ配置エペ 系統的手法ゎスんホタ、Ьь⑦Зииюみюネギゾ Ьь⑦Зии操作メ完全ズネギ有效ズ確立エペソゾ 困難ザエ。イヘズ、ガソプよスк①ЙЗソナシモジ ゾеьфУ化エペアシゎザわスゆソザ、顧客ソиュ みЭдЧヱメ顧客ソ特定ソЗУユюズ合よ入力シウ サ使用エペアシゾザわネオモ。ウギゎゲサ、ガホキ ホソ可能スЬь⑦Зии操作ズ選擇得點メコんペア シズプゲサ、顧客ソ選擇ズ合よプよズЁЗЪуメ調 整エペソゾ困難ザエ。 ガアザ、жлみжヤЬь⑦•Хみуソ目標ゾ、2 コソ言語ソ間ソ雙方向ソЬь⑦Зииれプヂ生成ソ хЫюメ構成ウ、Ьь⑦Зииれプヂ生成ソк①Й Зメ、高度ズеьфУ化イホギиュみЭдЧヱ制御 ソ、Ьь⑦ЗииソщЯЧЬシ操作ゎ得ヘホペ自動 的スヤк①みХメパゲギ ЁЗЪуズエペアシザエ。 ガソプよス目標メ達成エペギバズ、原語ソ文法シ УみヴЧЬ語ソ文法ソガホキホズプゲサ生ェペ翻譯 ソ組ソ注釋コわ構文Шэみメ、標準化イホギдみЖъ ⑦ソアホヘ注釋コわ構文Шэみズ轉換エペ方法メ我 ぼゾ考りネウギ。アよエホタ、ガソプよスШэみソ 組ソ間ソ基本的Ьь⑦ЗиищЯЧЬゾ自動的ス手 法ザ得ヘホネエ。Ьь⑦Зии得點シ生成得點メガ ソプよス配置イホギЬь⑦ЗиищЯЧЬズ關ウサ 定義ウ、最良ソсЧз⑦ヲネギゾ好ノソсЧз⑦ヲ メ見コんネエ。 ガソプよスхЫюザゾ、Ьь⑦Зии操作ゎ有限 個數ソЬь⑦ЗиищЯЧЬクんズ制限イホペ確立 ゎ高ネベネエ。イヘズ、標準化イホギ構文Шэみゾ ガホキホソ文法ズプゲサ作成イホペソザ、アソфロ ЯИуズプゲサ選擇イホギУみヴЧЬ語ソ構造ゾ、 原語ソ文法ズ影響イホネオモ。ウギゎゲサ、сЧз ⑦ヲゾ本質的ズ雙方向ザ、ジグヘソ側ろヘパ始バペ アシゎザわネエ。 構文的構造メ基本的Ьь⑦ЗиищЯЧЬズ分解 ウ、Ьь⑦Зииシ生成ソ得點ソギバソ一定ソ確率 的スхЫюメ使用エペアシズプゲサ、Ьь⑦Зии シ生成ソк①ЙЗメеьфУ化エペソゾ簡單ザエ。 ガソプよスеьфУ化イホギЬь⑦ЗиихЫюメ 用ゆサ、жлみжヤЬь⑦ゎ採用エペ手法ゾ特定ソ 顧客ソЗУユюズЬь⑦ЗииеУみ⑦メ調整エペ 潛在的能力メ增エアシズスベネエ。ウギゎゲサ、我 ぼゾアソ手法メ強ゑ支持ウサゆネエ。 4. 今後ソ目標 10年間近ゑ機械翻譯ソ研究開發ズ攜マゲギ後、ж лみжヤЬь⑦MTЁЗЪуソ商用運用メ通ウサ、機 械翻譯メプベ實用的ズ、ネギ廣ゑ使用イホペプよズ エペギバズゾ、新ウゆヵみеЗ•мみЗソ手法ゎ非 常ズ重要ス役割メ果ギエシ確信エペズ至ベネウギ。 要エペズ、人間ゾ一般的ス言語メхЫю化エペ能力 メ十分パゲサゆペゎ、ヵ⑦зшみУゾ大規模スЫみ У處理ズ有效ザエ。ウギゎゲサ、プゑ認識イホサゆ ペ言語學ソ現象メ利用ウサ、人間ゎ確率的ス言語х Ыюメ構成ウ、統計學的ズ十分確立イホギЪヱЯЧ ヱメパコ大わスヵみеЗろヘ、確率的スхЫюソ言 語еьфУメ評價エペアシゎ適切ザエ。 現在、アソ方向ザ、ゆゑコろソ高度スЪヱв①Ж みゎ開發中ザエ。特ズ、自動ヵみеЗ變換、注釋、 自動хЫю改良れプヂ、プベеьфУ化イホギ言語 хЫюゎ研究課題ズスゲサゆネエ。 參考文獻 [Chang 93]=Chang, J.-S. and K.-Y. Su, "A Corpus-Based Statistics-Oriented Transfer and Generation Model for Machine Translation" (「ヵみеЗ•мみЗ、統計學指向ソ機械翻譯ソギ バソЬь⑦Зииれプヂ生成хЫю」、TMI-93論文 集 pp.3--14、1993年) [Chen 91] Chen, S.-C., J.-S. Chang, J.-N. Wang and K.-Y. Su, "ArchTran:A Corpus-Based Statistics-Oriented English-Chinese Machine Translation System"(「ヤみヱЬь⑦:ヵみеЗ• мみЗ、統計學指向ソ機械翻譯ЁЗЪу」、第3回 機械翻譯ДтЧ Ь論文集 pp.33-40、1991年) [Su 90] Su, K.-Y. and J.-S. Chang, "Some Key Issues in Designing MT Systems(「MTЁЗЪ у設計ソワみрユ⑦Ь」、機械翻譯vol.5, no.4, pp.265-300、ヱэшみ③みヤロЫтЧヱ出版、1990 年) [Su 92] Su, K.-Y and J.-S. Chang, "Why Corpus-Based Statistics-Oriented Machine Translation(「スカヵみеЗ• мみЗ、統計學指 向ソ機械翻譯ろ」、TMI-92論文集pp.249-262、 1992年) [Su 93] Su, K.-Y. and J.-S. Chang, "Why MT Systems Are Still Not Widely Used? (「スカ MT ЁЗЪуゎネク普及ウスゆろ」、機械翻譯vol.7, no.4, pp.285-291、1993年)