首頁 > 移動互聯網 > 正文
分享到:

2018年印度互聯網高速發展將依靠語言技術

時間:2018-01-04 10:27:17 來源:創事記 評論:0 點擊:0

  

  2017年,印度在互聯網語言技術領域有了長足的發展,隨著移動用戶的大量上網,印度互聯網的面貌也發生了根本性的改變。該技術領域的快速發展推動了整個印度互聯網的發展。

  以下是2017年在語言科技領域發生的一些重要的飛躍以及它們對印度普通人的影響。

  印度語網民數量激增

  2017年4月,谷歌( Google)聯合畢馬威( KPMG)發布了一份題為《印度語——定義印度互聯網》的報告,內容涉及印度語在線的基本情況。

  1、印度語網民(2.34億)已經超過英語網民(1.75億)的數量,而且這一趨勢只會隨著時間的推移而加快。

  2、90%的印度人在未來五年內第一次上網,他們將使用自己的本土語言。這樣一來,使用印度語上網的用戶將達到5.36億。

  根據ReverieLanguageTechnologies的《數字印度語言報告》顯示:印地語、馬拉地語和古吉拉特語是網上使用最多的三種印度語言。

  受印度語言缺乏語言本地化和服務的困擾,這些印度語用戶以前得到的相關互聯網服務受到很大的限制。Reverie的報告顯示,這些網民僅能使用社交媒體、消息傳遞、瀏覽和娛樂等網絡服務。但這種情況將隨著印度語言技術的快速發展而有所突破,未來大量的互聯網應用將提供印度語的服務。

  移動設備將支持多種印度語言

  印度政府目前已經采取了重要的舉措,要求印度所有的移動設備都必須提供22種語言的數字印度語支持。一旦這項授權生效(2018年2月1日),印度所有的新手機都必須支持所有22種印度官方語言,以及至少兩種印度語言的輸入功能。

  也就是說在政策出臺之后,印度新上市的手機將可以滿足印度非英語人口(超過10億人)的使用需求。

  隨著大量廉價網絡數據服務和廉價手機數量的激增,這一新政策對印度移動互聯網的影響將是相當長遠的。

  政府網上服務將提供多語言查詢

  此外,印度政府一直在推動網上政府服務。隨著互聯網滲透率的增加,互聯網越來越成為政府服務的推廣平臺和推動者。

  各邦目前也在推動跨數字平臺的語言本地化,包括智能手機和網站。

  印度政府的UMANG應用程序已經于2017年11月推出,并支持12種印度語言。UMANG的本質是一款能夠讓公民發現和訪問政府服務的一款綜合性應用,這意味著UMANG的語言支持將有助于更容易地獲得政府服務。

  而BHIM的使命則是向大眾提供數字支付,同時也考慮到無障礙環境。它是在支持多種印度語言的情況下發布的,確保了普通印度公民能夠像說英語的上中產階級同胞一樣獲得數字支付服務。

  機器學習與語音搜索

  2017年語言技術領域最大的發展之一是機器學習和語音搜索的出現。

  機器學習有助于實現更精確、更精準的翻譯,這對于大規模本地化內容至關重要。它使翻譯系統能夠從數以百萬計的例子和模式中學習,并不斷提高其翻譯的可靠性。

  印度語言有一些類別是有特別之處的,可能會讓翻譯系統發生混淆,比如某些詞的官方語和口語是不同的。

  當然,語音搜索允許用戶通過與設備通話來查找內容。第一次上網的印度人可能會比較喜歡用語音搜索,因為用印度語來進行信息的輸入對他們來說是完全陌生的,需要一段時間的學習和適應,但聲音搜索卻不需要這么麻煩。Google的數據顯示,在印度使用Google搜索,28%的網民都是通過語音查詢來進行的。

  構建解決方案

  很多科技公司已經意識到,印度語言也需要提供數字支持,這涉及到創建一個完全針對印度語言優化的用戶體驗。僅僅是提供次優的或者拼湊的語言服務,用戶顯然是不接受的。但是,發展語言技術也帶來了許多挑戰。

  我們知道,歐盟擁有歐洲語言研究中心,這是一個多種歐洲語言的語料數據庫。而印度語言種類雖多,卻沒有這樣的語料庫。這意味著印度語言的這些資源必須從頭構建起來。

  這無疑是一個令人興奮的巨大商機,因為有大量的問題需要解決。無論什么解決方案最終都會影響到數億印度人的生活,成為他們日常生活的重要組成部分。

  那么,在接下來的2018年,那些想在印度語言技術發展方面有所斬獲的公司,就看你們能夠提供什么樣的解決方案了!

经典千炮捕鱼达人2