Asia-Pacific Association for Machine Translation

BehaviorTran: ガソ現狀、見通ウ、れプヂ原理

		台灣國立清華大學	電氣工學科
		Ж⑦Ё⑦•Хц⑦、ンみユみ•Зみ
				(張景新、蘇克毅)

住所:30043台灣 新竹市
email: shin@hermes.ee.nthu.edu.tw、
       kysu@bdc.com.tw

  1. 編成シ歷史的概觀

жлみжヤЬь⑦英中機械翻譯ЁЗЪу(Behavior-
Tran:舊稱ヤみヱЬь⑦ArchTran)ゾ、台灣エスマグ
中華民國ザ著手イホギアソ種ソ研究ザ最初ソパソザ
エ。ネギ、世界ザ初バサ商品化ウギ英中ЁЗЪуソ
チシコザパやベネエ。初バズ商品化ウギЁЗЪуゾ、
1989年ズээみЗウ、現在翻譯ДみжЗ•Й⑦Уみ
ソ中核シウサ稼慟ウサゆネエ。

  жлみжヤЬь⑦ズ關エペ研究ゾ、1985年5月ズ、
台灣ソ國立清華大學(NTHU)シжлみжヤ•ЪЧヱ•
ヵ⑦зшみУ社(BTC)シソ共同作業シウサ開始イホ
ネウギ。アソ作業ゾ、NTHUソ教授 蘇克毅 ゎ
指導ウ、地元ソ大學シ研究機關ソ數人ソк①ソヵ⑦
ДюУ⑦ЬゎДрみЬウネウギ。研究ソ擴大ズやマ
オ、アソMTЁЗЪуソ改良メ目的シウサ1988年2月
ズ設立ウギ、жлみжヤ•ЫЕユ⑦社(BDC, BTC 
R&DЙ⑦Уみ) デ移ウネウギ。

  жлみжヤЬь⑦MT R&Dヲюみкソ特徵ゾ、MT R
&Dヲюみкザやペシゆよクんザゾスゑ、內部共同機
械翻譯ДみжЗ•Й⑦Уみシウサソ役割パ果ギエシ
ゆよ點ザエ。アアザゾ、商業化ウギ顧客ДみжЗシ、
MT研究Хみуズ對エペэヤю•УЗヱ•иュみЭдЧ
ヱメ行ゆネエ。現在、れプガ 30人ソR&DЗУЧиゎ
R&DЙ⑦Уみザ慟ゆサれベ、ガソよグれプガ10人ゾ 
MT研究ヲюみкズ所屬ウネエ。MT翻譯ДみжЗ•Й
⑦Уみゾ、專門ソк①ЖラヱЬ•сбみЖцみシ專
從рЗЬ•リЫュУザ操作ウネエ。еみЬУユуソ
рЗЬ•リЫュУゾ、公共ソ電話бЧЬ③みヱメ通
ウサЙ⑦Уみシэ⑦ヱイホネエ。アソプよス編成ゾ、
MT環境ズれんペ實際ソ翻譯作業ソ全к①ЙЗズコゆ
サ調查エペギバソ良ゆ環境シスゲサゆネエ。

  アソR&DЙ⑦Уみゾ、學界シ強ゑ結ヂコゆサれベ、
アソ地域れプヂゆゑコろソ國際的ス團体ズれんペヵ
⑦зшみУ言語學會ソヤヱЪュйスф⑦дみザパや
ベネエ。國際會議、MT專門誌れプヂ一般ソNLP學界
誌ズ、50編メ超りペ技術論文メ發表ウサわネウギ。
技術論文ソ發表ゾ、アアザゾ定期的ズ行ゲサゆネエ。
ネギ、ROCLING協會(中華民國計算語言學學會)
ソ設立ф⑦дみソ一員ザパやベ、關連事業ズパ活發
ズ參加ウサゆネエ。イヘズ、北ヤфэロソゆゑコろ
ソ有名ス研究室シ、數件ソ國際的技術提攜ビ資源共
有關係メ結モザゆネエ。

 目標シウサ、ЗУ⑦Эヤ①⑦ソ機械翻譯ЁЗЪу
メ提供エペソザゾスゑ、ナニ內部(ユ⑦гヨЗ)翻譯
ソ環境ズ近ゆパソメщみЕズ提供エペアシザエ。ア
ホゾ設立以來ソрэЁみザエゎ、世界ソ商用MTソ運
用ソ成功例ズスヘゆ、「本物ソ解決策」メ求バペ顧
客ズ翻譯ДみжЗメ提供エペ最良ソ方法シゾ、顧客
メMTЁЗЪуソ保守經費スジザ煩マイォズ內部翻譯
メ提供エペアシクシソ結論ズ至ベネウギ。

 ガソ結果、VAN(付加價值通信網)мみЗソ翻譯Д
みжЗ•Й⑦Уみメ創設ウネウギ。ДみжЗ形態シ
ウサゾ、地方ネギゾ公共ソЫみУ•бЧЬ③みヱメ
通ェサ電子文書ゎ顧客、ДみжЗ•Й⑦Уみれプヂ
рЗЬ•リЫュУソ間メ行わ來ウネエ。アホズプゲ
サ、時間、ヵЗЬれプヂ機密保護ソ保証ズ關エペ顧
客ソ負擔メ大ゆズ削減ウネエ。ネギ、顧客ゎ自分ギ
グザ知識мみЗ(例りタ辭書)メ保守エペ經費パろ
ろベネオモ。

 現在、жлみжヤЬь⑦ゾ國際的ズ有名スヵ⑦зш
みУ企業數社メ含ハ顧客層メ確立ウネウギ。アホヘ
ソ顧客ゾ、ナシモジゎЛиЬヨラヤ、гみЭヨラヤ、
PCネギゾ③みヱЗЪみЁъ⑦ソ分野ザゾ世界ソЬЧ
кь⑦ヱソ有名企業ザエ。

 жлみжヤЬь⑦利用ゾ、ネォヵ⑦зшみУ•с
Яшヤюれプヂ關連Эワшф⑦Ьソ領域ゎ上ァヘホ
ネエ。ガウサ、機械ビ醫學スジ他ソ技術分野ズコゆ
サパ、イネゥネス私的、公的機關ズ對ウサДрみЬ
ウサゆネエ。

 アソЁЗЪуゾ、UNIX③みヱЗЪみЁъ⑦ソ環境
ザ開發イホサゆネエ。エスマグ、C言語ザ書ろホサ
ゆネエ。未處理ソ翻譯ゾ、ナシモジPC上ザ後編集イ
ホネエ。PC ゾ、 翻譯ДみжЗ•Й⑦УみソбЧЬ
③みヱメ通ウサ翻譯Дみдズ接續ウサゆネエ。ネギ、
高性能ソДрみЬ•Шみюメ翻譯③みヱЗЪみЁъ
⑦ズеЧンみЖウ、OCR、專用ЪワЗЬ•リЫュУ、
內部辭書、biЪワЗЬ、DTPスジソ支援機能ゎ統合
イホサゆネエ。アホヘДрみЬ•ЛиЬヨラヤゾ、
BDCソ他ソR&Dヲюみкろヘソ提供パウゑゾ共同開發
ザ實現ウネウギ。アホヘソ機能ズゾ、中英二ロ國語
ソ文書作成③みヱм⑦Хゎ組ノ入ネホサゆネエ。特
徵ゾ、中英二ろ國語ソЫЗヱЬЧк出版ЁЗЪуシ
ウサ、ЪワЗЬ•式•表•ヲьиュЧヱれプヂユф
みЖ作成用ソ十分ス機能メパコアシザエ。 

2. 一般的、技術的見通ウ

  жлみжヤЬь⑦ソ研究ゾ、從來ソЬь⑦Зии
мみЗソMT構造ろヘ著手ウネウギ。ЁЗЪуザゾ、
多ゑソюみюゎヵみЭ化イホ、種ぼソ言語學的課題
メ處理ウネエ。ウろウ、ЁЗЪуゎ擴大エペシ、ア
ソプよスюみю•мみЗソヤк①みХザゾゆゑコろ
ソ問題ズヅコろペアシゎマろゲサゆネエ。特ズ、や
ゆネゆス知識メ扱よギバソ客觀的選擇基準メ欠ゑア
シシ、複雜ザ不規則ス知識ソ扱ゆゎ困難ス點ゎ指摘
イホザゆネエ。юみюズ關ウザパ、時ぼ例外ゎ生ェ
ネエ。ЁЗЪу工學ソямюザゾ、異スペ時間、異
スペ人ぼソ間ソ、多量ザわバ細ろゆ知識ソ一貫性メ
維持エペソゾ困難ザエ。種ぼソ文獻ザ提案イホギプ
よズ、言語學ソ知識メ習得エペ系統的方法ゾネクク
ホパ確立ウサゆネオモ。

  アソプよズ、人間ゎ介入エペ多量ソわバ細ろゆ知
識ソ習得ゾ、費用シ時間ゎろろベネエ。ウギゎゲザ、
研究開始ろヘ2年後ズゾ研究ソ焦點ゾヵみеЗ•м
みЗソヤк①みХズ移ベネウギ。アホズプゲサ、ж
лみжヤЬь⑦•ЁЗЪуゾ、從來ソMT方式シ新ウ
ゆヵみеЗ•мみЗ•Ъヱв①Жみソ統合型、エス
マグ、現在MT界ザ「гユйэЧЭ方式」シ呼タホペ
パソズスゲサゆネエ。アソプよス構造メ持コжлみ
жヤЬь⑦ゾ、混成ソеみЖ⑦ヲ戰略 (ゆマフペп
Ьу•ヤЧк•еみЖ⑦ヲシЬЧк•Фヨ⑦•иュ
юУэ⑦ヲソ併用) シ得點コわеみЖ⑦ヲ•фロЯ
ИуれプッヵみеЗ•мみЗザ統計學指向ソеьФ
ユу(CBSO)メ採用ウサゆネエ。

  жлみжヤЬь⑦•ЁЗЪуソ研究ゾ、ヵみеЗ
•мみЗザ統計學指向ザやペシゆよ特徵ゎやベネエ。
ウギゎゲサ研究ゾ、言語хЫю•еьфУメ取得エ
ペギバソ系統的ろコ自動的ス方法メ設計ウ、やゆネ
ゆイメ分析エペギバソ一定ソ確率的得點機能メパコ
選擇基準メ使用エペ方向ズ向ろゲサゆネエ。

 CBSO言語хЫюソ開發ズれゆサ特ズ強調イホペソ
ゾ、やゆネゆイメ分析エペギバズ、完全ス意味解析
ザゾスゑ、識別機能メ使用エペアシザエ。アソ原理
ゾ、必要スやゆネゆイ分析機能メパグ、非常ズ小イ
スヵЗЬザ知識ソ取得シ保守メ行よ有效スヵみеЗ•
мみЗ•Ъヱв①Жみズ通ェペパソザエ。ヵ⑦зш
みУソ部分ザゾ、言語еьфУメ未知ソЪワЗЬズ
パ適用ザわペプよズ、жлみжヤЬь⑦ソ CBSOヤ
к①みХゾヵ⑦зшみУ•хЫюソ強健イズ重點メ
置ゆサゆネエ。

 アホヘメエトサ考慮ウサ、жлみжヤЬь⑦R&D
Хみуゾ、辭書解析、構文解析、意味解析、確率的
Ьь⑦Зииれプヂ生成ソхЫю、統一イホギ確率
的ス骨組ノソパシソエトサソパソズコゆサ、種ぼソ
選擇基準メ確立ウネウギ。ネギ、アホヘソхЫю用
ソ種ぼソ言語еьфУ上ザプベ良ゆ判斷メエペギバ
ズ、識別れプヂ強健指向ソЪヱЯЧヱパ確立ウサゆ
ネエ。 

3. 二ろ國語ソヵみеЗ集メパコ兩方向Ьь⑦Зии
ズ向んサ

 жлみжヤЬь⑦ソ操業以來、顧客ソナシモジゎ
翻譯出力メ公ズ「出版ザわペ」アシメ強ゑ求バサゆ
ペアシゎマろベネウギ。イヘズ、УみヴЧЬ言語ソ
文書ソЗУユюゎ選擇可能ザやホタシ望ハ顧客パや
ペザウブよ。アホゾ、通常、原語ソ文書ソЗУユю
シ異スペЗУユюザ翻譯出力ゎ得ヘホペギバザ、顧
客ズプゲサゾ翻譯イホギЫみУメ、長年ズマギゲサ
開發ウサわギЗУユюシ一致イオギナよゎ使ゆビエ
ゆギバザエ。 アホヘろヘ、顧客ゎ原語ソЗУユю
メ保持エペプベパ、УみヴЧЬ語メプベ好ネウゆЗ
Уユюザ作成エペアシソ方ズ關心ゎやペアシ、ガウ
サ、ЁЗЪуメ自分ギグソЗУユюズ適合イオギゆ
シゆよ強ゆ要求メパコアシゎよろゎマホネエ。ネギ、
顧客ゎ非常ズ關心メ示エ事柄シウサ、ガホキホソ顧
客ソ獨自ソ要求ズ合よプよズЁЗЪуメ調整エペソ
ズ費ビイホペ時間シ、顧客ソиュみЭдЧヱデソ應
答ズろろペ時間パ非常ズ重要ザエ。

 現在ソMTЁЗЪуゎネク廣ゑ利用イホサゆスゆ主
ス理由ソ1コゾ、生成イホギ出力ゎ原語ズ強ゑ影響
イホペ、エスマグ、ЗУユюゾ單純ズУみヴЧЬ語
ソбユЪュйЗзみロみゎ使よプよス文体ズゾスヘ
スゆシゆよ事實ズやベネエ。MTЁЗЪуソ從來ソЬ
ь⑦Зииシ生成ソк①ЙЗゾ、特定ソЬь⑦Зии
щЯЧЬ上ズ手作業ザヵみЭ化ウギЬь⑦Зиию
みюズ從よソザ、アホゾ當然ソアシザエ。Ьь⑦З
ии操作ゾ、原語ろヘУみヴЧЬ語デシ設計イホペ
ソザ、本質的ズゾ單方向ザエ。エスマグЬь⑦Зии
юみюゾ、原語ソ文法シ「正當」ザ「自然」スУみ
ヴЧЬ語ソ文法シズプゲサ生ォペ構文的構造間ソсЧ
з⑦ヲゎ最良ズスペプよズ調整イホサゆペマんザゾ
やベネオモ。

 ネギ、パよ1コソ問題ゾ、適切スЬь⑦Зиищ
ЯЧЬシガソプよス手法ズプペЬь⑦Зии操作ソ
正當スЁみン⑦Зメ確認エペアシザエ。有限個數ソ
基本的щЯЧЬズЬь⑦ЗиищЯЧЬメ配置エペ
系統的手法ゎスんホタ、Ьь⑦Зииюみюネギゾ
Ьь⑦Зии操作メ完全ズネギ有效ズ確立エペソゾ
困難ザエ。イヘズ、ガソプよスк①ЙЗソナシモジ
ゾеьфУ化エペアシゎザわスゆソザ、顧客ソиュ
みЭдЧヱメ顧客ソ特定ソЗУユюズ合よ入力シウ
サ使用エペアシゾザわネオモ。ウギゎゲサ、ガホキ
ホソ可能スЬь⑦Зии操作ズ選擇得點メコんペア
シズプゲサ、顧客ソ選擇ズ合よプよズЁЗЪуメ調
整エペソゾ困難ザエ。

 ガアザ、жлみжヤЬь⑦•Хみуソ目標ゾ、2
コソ言語ソ間ソ雙方向ソЬь⑦Зииれプヂ生成ソ
хЫюメ構成ウ、Ьь⑦Зииれプヂ生成ソк①Й
Зメ、高度ズеьфУ化イホギиュみЭдЧヱ制御
ソ、Ьь⑦ЗииソщЯЧЬシ操作ゎ得ヘホペ自動
的スヤк①みХメパゲギ ЁЗЪуズエペアシザエ。
 ガソプよス目標メ達成エペギバズ、原語ソ文法シ
УみヴЧЬ語ソ文法ソガホキホズプゲサ生ェペ翻譯
ソ組ソ注釋コわ構文Шэみメ、標準化イホギдみЖъ
⑦ソアホヘ注釋コわ構文Шэみズ轉換エペ方法メ我
ぼゾ考りネウギ。アよエホタ、ガソプよスШэみソ
組ソ間ソ基本的Ьь⑦ЗиищЯЧЬゾ自動的ス手
法ザ得ヘホネエ。Ьь⑦Зии得點シ生成得點メガ
ソプよス配置イホギЬь⑦ЗиищЯЧЬズ關ウサ
定義ウ、最良ソсЧз⑦ヲネギゾ好ノソсЧз⑦ヲ
メ見コんネエ。

 ガソプよスхЫюザゾ、Ьь⑦Зии操作ゎ有限
個數ソЬь⑦ЗиищЯЧЬクんズ制限イホペ確立
ゎ高ネベネエ。イヘズ、標準化イホギ構文Шэみゾ
ガホキホソ文法ズプゲサ作成イホペソザ、アソфロ
ЯИуズプゲサ選擇イホギУみヴЧЬ語ソ構造ゾ、
原語ソ文法ズ影響イホネオモ。ウギゎゲサ、сЧз
⑦ヲゾ本質的ズ雙方向ザ、ジグヘソ側ろヘパ始バペ
アシゎザわネエ。

 構文的構造メ基本的Ьь⑦ЗиищЯЧЬズ分解
ウ、Ьь⑦Зииシ生成ソ得點ソギバソ一定ソ確率
的スхЫюメ使用エペアシズプゲサ、Ьь⑦Зии
シ生成ソк①ЙЗメеьфУ化エペソゾ簡單ザエ。
ガソプよスеьфУ化イホギЬь⑦ЗиихЫюメ
用ゆサ、жлみжヤЬь⑦ゎ採用エペ手法ゾ特定ソ
顧客ソЗУユюズЬь⑦ЗииеУみ⑦メ調整エペ
潛在的能力メ增エアシズスベネエ。ウギゎゲサ、我
ぼゾアソ手法メ強ゑ支持ウサゆネエ。 

4. 今後ソ目標

  10年間近ゑ機械翻譯ソ研究開發ズ攜マゲギ後、ж
лみжヤЬь⑦MTЁЗЪуソ商用運用メ通ウサ、機
械翻譯メプベ實用的ズ、ネギ廣ゑ使用イホペプよズ
エペギバズゾ、新ウゆヵみеЗ•мみЗソ手法ゎ非
常ズ重要ス役割メ果ギエシ確信エペズ至ベネウギ。
要エペズ、人間ゾ一般的ス言語メхЫю化エペ能力
メ十分パゲサゆペゎ、ヵ⑦зшみУゾ大規模スЫみ
У處理ズ有效ザエ。ウギゎゲサ、プゑ認識イホサゆ
ペ言語學ソ現象メ利用ウサ、人間ゎ確率的ス言語х
Ыюメ構成ウ、統計學的ズ十分確立イホギЪヱЯЧ
ヱメパコ大わスヵみеЗろヘ、確率的スхЫюソ言
語еьфУメ評價エペアシゎ適切ザエ。

 現在、アソ方向ザ、ゆゑコろソ高度スЪヱв①Ж
みゎ開發中ザエ。特ズ、自動ヵみеЗ變換、注釋、
自動хЫю改良れプヂ、プベеьфУ化イホギ言語
хЫюゎ研究課題ズスゲサゆネエ。 

參考文獻
[Chang 93]=Chang, J.-S. and K.-Y. Su, "A 
Corpus-Based Statistics-Oriented Transfer and
Generation Model for Machine Translation"
(「ヵみеЗ•мみЗ、統計學指向ソ機械翻譯ソギ
バソЬь⑦Зииれプヂ生成хЫю」、TMI-93論文
集 pp.3--14、1993年)

[Chen 91] Chen, S.-C., J.-S. Chang, J.-N. 
Wang and K.-Y. Su, "ArchTran:A Corpus-Based 
Statistics-Oriented English-Chinese Machine  
Translation System"(「ヤみヱЬь⑦:ヵみеЗ•
мみЗ、統計學指向ソ機械翻譯ЁЗЪу」、第3回
機械翻譯ДтЧ Ь論文集 pp.33-40、1991年)

[Su 90]  Su, K.-Y. and J.-S. Chang, "Some 
Key Issues in Designing MT Systems(「MTЁЗЪ
у設計ソワみрユ⑦Ь」、機械翻譯vol.5, no.4,
pp.265-300、ヱэшみ③みヤロЫтЧヱ出版、1990
年) 

[Su 92]  Su, K.-Y and J.-S. Chang, "Why 
Corpus-Based Statistics-Oriented Machine 
Translation(「スカヵみеЗ• мみЗ、統計學指
向ソ機械翻譯ろ」、TMI-92論文集pp.249-262、
1992年)

[Su 93]  Su, K.-Y. and J.-S. Chang, "Why MT 
Systems Are Still Not Widely Used? (「スカ MT 
ЁЗЪуゎネク普及ウスゆろ」、機械翻譯vol.7,
no.4, pp.285-291、1993年)