<optgroup id="6rfrw"></optgroup>
      1. <legend id="6rfrw"></legend>

          1. <optgroup id="6rfrw"></optgroup>
          2. <span id="6rfrw"><output id="6rfrw"><nav id="6rfrw"></nav></output></span>
          3. <optgroup id="6rfrw"></optgroup>

            <acronym id="6rfrw"></acronym>

            <optgroup id="6rfrw"><i id="6rfrw"><del id="6rfrw"></del></i></optgroup>
            1. <optgroup id="6rfrw"></optgroup>
              <optgroup id="6rfrw"><li id="6rfrw"></li></optgroup>
            2. 一、學會新聞

              第九屆中國中文信息學會語言技術暑期學校成功舉辦

                  2014年8月15日至17日,第九屆中國中文信息學會語言技術暑期學校在天津大學計算機學院成功舉辦。由中國中文信息學會及微軟亞洲研究院聯合主辦的語言技術暑期學校自2005年以來已成功舉辦八屆。往屆暑期學校在承辦方哈爾濱工業大學語言技術研究中心的竭誠努力下,獲得了廣大師生的普遍好評,為自然語言技術的人才培養和技術推廣做出了卓越貢獻,數以千計的學子在暑期學校中獲得了來自國內外頂級企業及研究機構的著名學者的當面指導,受益匪淺。自今年起,中國中文信息學會進一步將暑期學校推廣到全國知名高校。

                  2014年度暑期學校由天津大學計算機學院網絡智能信息技術研究所承辦。本屆暑期學校邀請到了來自微軟、百度、北京大學和中科院的6位著名專家為學員授課。其中,包括了微軟亞洲研究院首席研究員周明博士,和研究院韋福如博士,介紹了社會媒體內容分析的研究進展;中科院信息工程研究所王斌研究員為大家深入淺出的介紹了信息檢索的關鍵技術;北京大學計算語言學研究所所長王厚峰教授介紹語篇處理的最新進展;百度自然語言處理技術負責人吳華博士介紹了機器翻譯技術理論和應用;最后百度深度學習研究院副院長,國家千人計劃專家余凱博士為大家梳理了機器學習領域近年來的發展脈絡和深度學習的內容。

                  中國中文信息學會理事長,哈爾濱工業大學李生教授,暑期學校創始人微軟亞洲研究院周明教授,天津大學計算機學院院長,千人計劃專家黨建武教授,會務組主席,天津大學教授,天津市千人計劃專家宋大為教授出席了暑期學校并致辭。來自51個高校,研究所和企業的近200名研究生、教師和研究人員共聚一堂,聽取了為時三天的課程,學員規模達到了歷屆最大。通過對自然語言處理及相關技術的最新進展的深入學習和探討,大家不僅學有所得,也對自然語言處理技術的發展前景充滿了信心,紛紛表示希望暑期學校能夠越辦越好,成為自然語言處理領域的重要交流平臺,為自然語言處理及相關技術的發展貢獻力量!

              學會青工委執行委員劉康助理研究員和理事趙軍研究員的學術論文獲COLING2014最佳論文獎

                  8月29日,在第25屆計算語言學國際會議COLING2014頒獎儀式上,我學會青年工作委員會執行委員劉康助理研究員和學會理事趙軍研究員的學術論文"Relation Classification via Convolutional Deep Neural Network"(作者:曾道建,劉康,來斯惟,周光有,趙軍)獲得大會最佳論文——IBM Watson Best Paper Award。

                  COLING會議是計算語言學領域的頂級國際會議,由國際計算語言學學會(the International Committee on Computational Linguistics,ICCL)主辦,每兩年一屆。本屆會議于2014年8月23到29日在愛爾蘭的都柏林召開,世界各地近700人參加了會議。這次會議共收到691篇論文,其中錄用口頭報告論文139篇,錄用率為20.1%。由全世界幾十位權威專家組成的評獎委員會通過投票評出了兩篇最佳論文,該論文得票數名列第一,得到了國際同行的廣泛關注,認為是該領域一個開創性的工作,將對關系分類這一任務產生重要影響。COLING2014最佳論文獎由IBM Watson研究中心冠名贊助,該中心于2011年推出了一臺能快速回答自然語言復雜問題的機器——Watson,并在美國著名智力問答競賽節目《危險邊緣》中戰勝人類選手。

                  互聯網上存在大量的非結構化電子文本,如新聞、博客、電子郵件通信、政府文件、聊天記錄等。如何幫助人們理解這些數據?普遍的觀點是通過注釋語義信息,把非結構化文本變成結構化文本,其中的關鍵技術之一是實體語義關系分類。傳統的關系分類主要采用有監督的方法,研究重點在于找出更具區分性的特征。傳統的特征提取憑借經驗進行,依賴于現有的自然語言處理工具(詞性標注、句法分析、實體識別等)。然而,對于大規模網絡信息而言目前的自然語言處理工具性能有限,同時傳統方法也會導致處理過程中的誤差累積。針對上述這些問題,該獲獎論文提出了基于卷積深層神經網絡(Convolutional Deep Neural Network)的文本語義特征學習方法;利用卷積深層神經網絡,自動學習表征實體語義關系的詞匯特征、上下文特征以及實體所在的句子文本特征等;相對于以往關系分類方法,該方法不需要利用NLP處理工具(POS、NER、Parsing等)抽取特征,極大的改善了特征抽取過程中多個處理環節所帶來的誤差累積問題。實驗結果表明,相對于已有state-of-the-art方法,該方法在關系分類任務上性能有顯著提升。

               

              二、學術活動

              第八屆全國漢字信息處理技術研討會(CIPT2014)

                  為充分交流漢字信息處理技術中的最新成果,推進中文信息處理技術的發展,中國中文信息學會漢字信息處理系統專業委員會、漢字字形信息專業委員會、漢字編碼信息專業委員會、咨詢委員會將于2014年10月底在北京聯合召開全國漢字信息處理技術研討會(The 8th China National Conference on Chinese Character Information Processing Techniques,簡稱CIPT2014)。會議由漢字信息處理系統專委會承辦。誠摯地邀請和歡迎中文信息處理技術相關的專家學者參會。

                  重要日期

                  投稿截止日期: 2014年9月15日

                  論文錄用與會議通知時間:2014年9月30日前

                  會議日期:2014年10月27日-28日

                  詳細事宜請參考學會網站

              第十三屆全國計算語言學學術會議將于2014年10月18日—19日在武漢舉行

                   "第十三屆全國計算語言學學術會議"(The Thirteenth China National Conferenceon Computational Linguistics,CCL2014)將于2014年10月18日—19日在華中師范大學舉行。作為國內最大的自然語言處理專家學者的社團組織——中國中文信息學會(CIPS)的旗艦會議,全國計算語言學會議從1991年開始每兩年舉辦一次,從2013年開始每年舉辦一次。CCL著重于中國境內各類語言的計算處理,為傳播計算語言學最新的學術和技術成果提供了廣泛的交流平臺。

                  重要日期

                  報到時間:2014年10月17日8:00

                  召開時間:2014年10月18日至19日(會期兩天)

                  詳細事宜請參考會議網站

              第二屆全國中文知識圖譜研討會將于2014年10月17日在武漢舉行

                   知識圖譜(Knowledge Graph)是當前學術界和企業界的研究熱點。中文知識圖譜的構建對中文信息處理和中文信息檢索具有重要的價值。作為國內最大的自然語言處理專家學者的學術類社團團體——中國中文信息學會(CIPS)主辦的前沿學術研討會之一,本次會議將與第十三屆全國計算語言學會議在同一會議地點舉辦,會務、交通等詳細信息敬請查看第十三屆全國計算語言學會議網站中的參會說明部分。

                  重要日期

                  報到時間:2014年10月16日14:00

                  召開時間:2014年10月17日(會期一天)

              第三屆CIPS-SIGHAN中文處理資源與評測國際會議(CLP-2014)將于2014年10月20日—21日在武漢舉行

                   2014年中文處理資源與評測國際會議(CLP-2014)由中國中文信息學會(CIPS)和國際計算語言學協會中文處理專業興趣組(SIGHAN)聯合組織。首屆中文處理資源與評測國際會議(CLP-2010)與第23屆國際計算語言學大會(COLING-2010)同期在北京舉辦。第二屆中文處理資源與評測國際會議(CLP2012)于2012年12月20-21日在中國天津大學舉行。本屆大會CLP2014將于2014年10月20-21日在中國華中師范大學舉行。

                   本次中文處理資源與評測國際會議(CLP-2014)旨在為中文處理領域中全球的研究人員提供一個展示研究成果、交流學術思想、探索研究新方向、推動研究發展的平臺。CLP-2014還將舉辦一個國際評測競賽,包括四項評測任務:中文分詞、中文拼寫檢查、簡體中文句法分析、中文人物屬性抽取。有關此次國際評測競賽的詳細信息,請參見 http://www.lance-lee.com/clp2014/webpage/cn/bake-off.htm。本次會議將與第十三屆全國計算語言學會議在同一會議地點舉辦,會務、交通等詳細信息敬請查看第十三屆全國計算語言學會議網站中的參會說明部分。

                  重要日期

                  報到時間:2014年10月19日8:00

                  召開時間:2014年10月20日至21日(會期兩天)

              三、學會通知

              中國中文信息學會會員發展工作的通知

                  為推進學會的改革,建立以會員為主體的管理體制,健全會員管理制度,按照中國科協《關于規范全國性學會個人會員登記號的通知》的要求和規定,結合本會的具體情況,建立個人會員登記制度。

              會員登記的簡要流程:

                  1.下載會員申請表,填寫完成后發送至學會郵箱:cips_m@iscas.ac.cn。

                  2.收到會員信息確認函后繳納學會年度會費, 完成會員資格認證。

              2014年度"中國中文信息學會"個人會員收費標準:

                  個人會員:120元/年    學生會員: 60元/年

              會員費繳費方式:

                  (1) 銀行轉賬:

                     開戶銀行:工商行北京市分行海淀西區支行 戶名:中國中文信息學會 賬號:0200004509014415619

                  (2) 郵局匯款:

                     地址:北京8718信箱"中國中文信息學會" 收款人:中國中文信息學會 郵政編碼:100190

                  (3) 學會支付寶賬號轉賬:

                     戶名:中國中文信息學會 賬號:cips_pay@163.com

                  (4)中國中文信息學會辦公室繳費

                     地址:北京市海淀區中關村南四街4號院7號樓201房間 聯系電話:010-62562916

                  會員經注冊并繳費后,將獲得會員登記號和會員證。在參加學會主辦的各類學術活動時,憑會員證將享受會費優惠;定期獲贈中國中文信息學會會員通訊(電子版)。

                  為鼓勵更多學者加入學會,完成2014度會員登記的全體會員和部分學生會員(以繳費順序,先到先得,贈完為止),將獲贈2014年度全年《中文信息學報》(紙質版)。

              四、學術動態

              SIGIR 2015 明年8月9-13日在智利的圣地亞哥舉行

                  SIGIR 2015 明年8月9-13日在智利的圣地亞哥舉行。長文投稿截止日期為2015年1月28日。

                  http://www.sigir2015.org/

              COLING 2016將在日本大阪舉辦

                  在愛爾蘭都柏林的COLING 2014閉幕式上,委員會宣布COLING 2016將在日本大阪舉辦,日本情報通信研究機構(NICT)主辦。


              Twitter向所有賬號開放推文分析工具

                  Twitter 前端工程師 Ian Chan 日前發推文宣布,Twitter 將向其所有用戶開放推文分析工具(Tweet Activity Analytics)。這是 Twitter 在 7 月推出的一個與 Google Analytics 相似的文本分析工具,使用該工具的用戶可以對自己發出的推文進行量化分析,量化的指標包括一定時間內的曝光度、點擊量、互動量等。之前,這項功能僅對廣告主開放,以方便他們更好的衡量自己在 Twitter 上投放廣告的效果。從今天起,這項功能將面向所有賬號開放使用至少 14 天,但不涉及受限、受保護以及停用的賬號。并且,可分析的推文語種主要為英語、法語、西班牙語和日語。


              IBM具備閱讀和學習能力的人工智能Watson投入使用,開始服務于科研人員

                  IBM8月28號宣布,他們旗下的 Watson 系統投入使用,開始為一些科學家服務,加速研究的進展。IBM 最新的人工智能可以閱讀文獻、理解化學反應式和數據圖表。

                  Watson 是一臺超級計算機,由 90 臺 IBM 的 Power 7 服務器并行組成。和 Google、微軟的人工智能相比,它(還是應該用他?)從硬件芯片構架就開始模擬人類神經元; IBM 的 "DeepQA" 技術開發,它可以聽取人類的問題,在浩如煙海的數據中尋找答案并用自然語言回答。

                  http://www.36kr.com/p/214911.html

              科大訊飛智能家庭語音產品發布

                  近日,科大訊飛(002230,股吧)在京舉行"語音點亮生活—科大訊飛智能家庭語音產品發布會",并啟動"訊飛超腦"計劃。

                  據了解,產品面向智能家庭領域,包括新版本語音助手靈犀3.0、語音交互的訊飛智能音箱、智能電視交互的"未來遙控"等?拼笥嶏w董事長劉慶峰詳細介紹了近年來科大訊飛在智能語音和人工智能方面的創新發展?拼笥嶏w還將配套語音新投基金,聯合創業投資機構對優質項目進行投資。

                  http://tech.hexun.com/2014-09-01/168086162.html

              五、學術資源

              CIKM 2014 Accepted Papers
              http://cikm2014.fudan.edu.cn/index.php/Index/info/id/11

              Deep Learning KDD 2014 Tutorial
              http://www.cs.toronto.edu/~rsalakhu/kdd.html
                  由Russ Salakhutdinov在KDD 2014中給出的關于Deep Learning 的tutorial,包括RBMs, DBMs, DBNs, 及multimodal learning。相關例子和代碼見:http://deeplearning.cs.toronto.edu/。

              Tutorial: Statistical Methods for Mining Big Text Data
              http://www.itee.uq.edu.au/dke/filething/get/855/text-mining-ChengXiangZhai.pdf
                  翟成祥老師(UIUC)今年在澳大利亞數據庫博士短訓班的教程:"Statistical Methods for Mining Big Text Data" 介紹兩種基于統計語言模型(Statistics Language Model)的基本話題模型(Topic Model): LDA和PLSA的原理及應用。最后列出六個未來研究課題

              微軟研究院教授峰會的深度學習討論會相關資源
              http://research.microsoft.com/en-us/events/fs2013/agenda_collapsed.aspx
                  包含Li Deng, John Platt (微軟),Yoshua Bengio(蒙特利爾大學),Honglak Lee(密歇根), Andrew Ng (斯坦福), Ruslan Salakhutdinov(多倫多)等人的報告PPT和視頻。

              斯坦福大規模網絡數據集大全
              https://snap.stanford.edu/data/
                  由斯坦福教授Jure Leskovec整理,可免費下載。共包括十多種不同類型的網絡數據集(社交;在線社區;電子郵件;引用;Web等等),其中Friendster數據集有6千5百萬節點,18億條邊。

              《紐約時報》標注數據集
                  https://code.google.com/p/nyt-salience/
                  訓練集包括100,834文件,19,261,118標注實體。測試集合包括9,706文件,187,080標注實體。

              綜述專著:Graph-Based Semi-Supervised Learning
                  http://www.morganclaypool.com/doi/abs/10.2200/S00590ED1V01Y201408AIM029
                  While labeled data is expensive to prepare, ever increasing amounts of unlabeled data is becoming widely available. In order to adapt to this phenomenon, several semi-supervised learning (SSL) algorithms, which learn from labeled as well as unlabeled data, have been developed. In a separate line of work, researchers have started to realize that graphs provide a natural way to represent data in a variety of domains. Graph-based SSL algorithms, which bring together these two lines of work, have been shown to outperform the state-of-the-art in many applications in speech processing, computer vision, natural language processing, and other areas of Artificial Intelligence. Recognizing this promising and emerging area of research, this synthesis lecture focuses on graph-based SSL algorithms (e.g., label propagation methods). Our hope is that after reading this book, the reader will walk away with the following: (1) an in-depth knowledge of the current state-of-the-art in graph-based SSL algorithms, and the ability to implement them; (2) the ability to decide on the suitability of graph-based SSL methods for a problem; and (3) familiarity with different applications where graph-based SSL methods have been successfully applied.


              精品国产免费第一区二区三区,国产精品无需播放器在线观看,国产精品一区第二页,中文字幕网