學年學期Academic Year/Semester: 102學年度第1學期 課程代號Course Number: 993063 授課教師Instructor: 張景新 課程中文名稱Course Title(Chinese): 自然語言密碼與資訊應用 課程英文名稱Course Title(English): Natural Language Codes and Information Applications 開課年級Grade: 1 學分數Credits: 3.0學分 上課地點Class location: 科三207 上課時間Class hours: 2fgh 本課程可培養學生之核心能力(Core competency)如下列: 創新學習 國際視野 一、課程目標Course objectives: (請任課教師具體說明課程目標,並加強與核心能力關聯的論述。) 電腦有一天能夠像科幻小說描述的那樣,跟我們交談? 有智慧到能解答所有問題嗎? (iPhone 4S 的 SIRI 是不是這樣的一個雛型?什麼是終極答案?) 為什麼 IBM 的 Watson 電腦可以“聽懂”人話,並打敗益智比賽冠軍的大帥哥?到底要怎樣才可以做到? 語言、資訊 (尤其是網路上大量但雜亂的資訊)、知識,跟具有人工智慧的電腦,到底有什麼關係? Google, Microsoft, Apple, Facebook, 百度, 華為,... 這些大公司為什麼到處找人, 積極研發自然語言處理的技術? 你的專業課題跟職業生涯,會從語言處理技術或應用獲得幫助嗎? 這門課也許會讓你有點初步的線索。 幾乎所有的人類知識,都是以自然語言的文字或語音的形式(如中英文)儲存起來的。 這些知識目前以各種不同的語言,廣泛藏匿在網際網路的大量文字或語音資料之中。 因此,要應用大量網際網路的資訊與知識,自動挖掘文字中的寶藏與密碼, 而不碰觸到自然語言的處理技術,包括跨越不同語言的障礙,是絕對不可能的。 本課程主要目的,在於透過簡單而非正式的介紹,讓學生瞭解自然語言如何跟日常的 資訊應用(如搜尋引擎及智慧型手機 iPhone 4S 的 SIRI 語音助理)產生關聯,並教導學生基本的 語言處理問題與技術,激發學生的創意,創造有趣的網際資訊應用,成為網路應用的開創者; 或是有創意的使用者,以協助及刺激開發者,開發出更符合使用者期待的應用, 讓學生充分了解語言處理的技術與應用如何幫助他的日常生活與職業生涯。 * 資工及電機系同學, (或上過基本機率統計且對 How-To-Do-It 技術有高度興趣的同學, 不限年級), 建議直接修讀或增修資工系上學期開的《自然語言處理》課程, 可直接接觸技術層面的課題. 這樣以後到 Google, Microsoft, Facebook, 百度等大公司求職 的機會可以多一點。(如不清楚自己的背景適不適合, 可先跟老師聊聊, 或來聽第一堂課.) 主要課程目標摘要如下: 1. 介紹自然語言的基本應用及基礎處理課題及技術。 2. 引導學生發掘以文字為本的網路資訊所隱藏的巨大能量及創新應用。 3. 啟發學生建立語言文字為本的網路雲端應用及營運模式。 二、師生晤談時間及地點Instructor office hours: - 3ij @ 科三館 316 三、授課方式Teaching approach: - 投影片講課, 看YouTube影片等輔助教材為主 - 問答, 討論, 報告, 小考, 計畫為輔 - 依學生人數及學習狀況機動調整比重 - 請同學準備一本空白筆記本, 注意老師隨機補充的材料 (加分可) - 投影片有不認識的英文字隨時發問 四、評量方式Grading criteria:(含評量項目及所佔比例,請運用多元評量) - 暫定: 出席狀況, 討論及學習態度(30%) +平時成績(20%) +期中考/作業(20%) +期末報告/作業(30%) - 平常筆記可做為額外加分參考 - 評量方式視情況調整項目及比重 - 缺課情況嚴重者, 直接當人, 沒得補救 (independent of your other scores) !! - 如果你是因為別的通識課沒得修, 衝堂或居於與課程內容無關的奇怪理由, 所以選這門課, 應該於聽過一兩堂後儘快決定是否退選 五、參考書目Textbook & references:(酌列作者姓名、出版年份、書名、出版書局等資料) (一)教科書: - 無,課程重心以老師自行撰寫之投影片為主軸。 (二)參考書:(資工系《自然語言處理》課程教科書及參考書, 老師備課參考) 1. Foundations of Statistical Natural Language Processing, by Christopher D. Manning and Hinrich Schutze, MIT Press, 1999. (NLP@CSIE course textbook) 2. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, (2nd Ed.) by Daniel Jurafsky & James H. Martin, Pearson Prentice Hall, 2009. 3. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development, by XueDong Huang, Alex Acero and Hsiao-Wen Hon, Prentice Hall PTR, Upper Saddle River, NJ 07458, USA, 2001. http://www.phptr.com 4. CJKV Information Processing: Chinese, Japanese, Korean & Vietnamese Computing, by Ken Lunde, O'reilly, USA, 1999. (Chinese edition available) 5. Lecture for Statistical Natural Language Processing, by Keh-Yih Su (蘇克毅) and Jing-Shin Chang (張景新), Microsoft Research Asia (MSRA, 微軟亞洲研究院), Beijing, 2002. (老師 2002 年在北京微軟研究院為高校生及微軟研究員上課的投影片.) 6. Papers on NLP issues 7. http://nlp.csie.ncnu.edu.tw/~shin/crs/shin.crs.html [My NLP Course Materials] 8. 其他參考材料: 網際網路各種線上資訊, Youtube 影片 六、教學進度(週次、授課主題、教學活動、評量方式/作業、章節) Course schedule (week, topic, activities, evaluation/assignment, text, etc.): 課程內容:(**每學期視最新技術及應用發展調整重點及順序. 但限於時間, 不一定都能講到.**) 01. 誰在乎自然語言應用及處理? - Microsoft, Google, Apple 炒翻天 02. 語言裡有蝦米密碼? - 《聖經密碼》的故事 – The Power of Languages and Texts 03. 語言裡也有寶藏? - 搜尋引擎、資訊檢索、社群網站與語言障礙 (Language barrier) -- 讓 Google & Apple & Facebook 賺翻的語言文字應用 04. 寶藏、密碼何處尋? - 語言障礙及語言翻譯的秘密 -- 自動翻譯機與自然語言處理的一般架構 & Problems with Languages 05. 解讀外星人、寵物、寶寶的語言 – 統計式機器翻譯系統自動建構 06. 如何寫出莎士比亞的文章、製造羅大佑的音樂 – Language Model 07. 語言學習與文書處理 08. 電腦也會改錯字改作文? - 英檢高分的秘密 09. 電腦也會出考題? 改考卷? 10. 電腦也會自動寫論文、報告? 理由產生器, 文章產生器, 對話產生器 ... 的秘密 11. 網路知識家: 自動回答問題的 Q&A 系統 -- Watson: 益智問答比人類還厲害的機器 (IBM, 2011) -- SIRI: 無所不知的 iPhone 4S 語音助理 (Apple, 2011) 12. 人/事/時/地/物: 常常想問的問題 (FAQ) 13. 老闆的電腦秘書: Text Summarization 14. 不用填問卷的民意調查、產品推薦: Opinion Analysis 15. 天下有白吃的資訊? -- Google 怎麼用文字做生意? 免費的網站服務安全嗎? 語言處理是現代電腦讀心術? 監視你的一舉一動?? 16. 天下沒有不是的資訊? -- 文件分類、垃圾信防堵、文字炸彈 (Google bomb) 17. 辭典: 未知詞、連用詞、專業術語、雙語詞典的自動建構 18. 中文處理: 中文斷詞、縮寫、音譯、繁簡術語互譯 19. 如何幫助身障、視障人士輕易獲取資訊 20. 虛擬主播: 文字轉語音的應用 21. 音樂 – 聲音的語言、音樂的產生:作曲/作詞/伴奏/編曲 22. 音樂的推薦、搜尋、部落格配樂、對詞 23. 樂活人生: 旅遊資訊、美食資訊、Location-Based Services 24. 想想自然語言處理怎麼幫你創業賺錢? 25. 電腦也會預測趨勢 -- Google Trend 與「補教人生」 26. 教機器人說謊很難嗎? 電腦也會學髒話? -- 機器人怎麼幫老人家買東西, 友善的機器人與人機對話的模式 **. more ... 99. 跟其它當紅應用的結合 (GPS Location Based Services, Social Network ...) 教學進度: 上述課程內容, 依同學實際接受情形調整. 同學可能需針對上述課程內容, 接受老師指定, 收集相關資料進行報告 (如相關資訊服務使用經驗、好玩的事、不完美的功能、創意與建議等), 或翻譯影音補充資料 (如 YouTube Video). 期末同學可能必須分組報告, 針對某一自然語言相關應用, 提出虛擬的網路應用方案. 七、TA協助事項Teaching Assistant tasks: - 收集相關線上資訊, 協助同學學習, 討論 八、備註Remarks: 教學網站:(不使用 Moodle) http://nlp.csie.ncnu.edu.tw/~shin/ (http://nlp.csie.ncnu.edu.tw/~shin/crs/shin.crs.html) 相關教學投影片不定期更新. 可下載最近版本作為預習材料. 深底投影片請於列印時選擇 '純黑白' 選項列印, 以免耗費印表機碳粉. 九、本課程可培養學生之核心能力與教學活動及評量方法對應表 教學活動: 1.課堂討論(含個案討論) 2.書面報告、作業、作品、實驗 3.學生口頭報告 4.課程規劃之校外參訪及實習 5.證照/檢定 6.參與課程規劃之校內外活動及競賽 7.課外閱讀 8.其他 評量方法: 1.紙筆考試或測驗 2.實作評量﹙含口頭、書面報告、實習、表現評量﹚ 3.其他表現 培養學生創新學習之教學活動: 1, 2, 3 培養學生創新學習之評量方法: 1, 2 培養學生國際視野之教學活動: 1, 2, 3 培養學生國際視野之評量方法: 1, 2 ~~~~~~~~~~~~~~~~~~~~(Rev 1.1) (2013/08/12)~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~