行業(yè)資訊
高考人機大戰(zhàn):機器10分鐘交卷,人類僅多考了1分
發(fā)表日期:2017年06月09日導語:兩名考生均是智能AI機器人,分別是學霸君開發(fā)的智能教育機器人Aidam和成都準星云學科技有限公司開發(fā)的人工智能系統(tǒng)AI-Maths。
6月7日數(shù)學高考當天,兩名特殊的“考生”參與了高考。其中一名北京的“考生”只用了不到十分鐘就答完2017年北京卷文科數(shù)學題,完成包括客觀題和主觀題在內的整張試卷,成績?yōu)?34分。據(jù)稱這還是該考生把做題速度放慢六倍的結果。在距離北京兩千公里之外的成都,另一名“考生”則花了22分鐘做完同樣考題,成績是105分。
兩名考生均是智能AI機器人,分別是學霸君開發(fā)的智能教育機器人Aidam和成都準星云學科技有限公司開發(fā)的人工智能系統(tǒng)AI-Maths。
有觀點認為,未來5-10年人工智能或將成為教育行業(yè)變革最重要的解決方案,推進智能化教育,構建以學習者為中心的教學模式,能夠改進傳統(tǒng)教育的不足,彌補傳統(tǒng)教育的短板。
智能AI為什么選擇考數(shù)學?
學霸君開發(fā)的智能教育機器人Aidam和成都準星云學科技有限公司開發(fā)的人工智能系統(tǒng)AI-Maths選擇的都是2017高考數(shù)學考試。
為什么智能機器人都熱衷于比拼數(shù)學呢?
學霸君創(chuàng)始人張凱磊表示,“一千個人心中有一千個哈姆雷特,但是世界上只有一個勾股定理”。數(shù)學、物理等理科類科目是強邏輯鏈路的,考點基本穩(wěn)定,容易判定對錯。同時,數(shù)學試卷中包括簡單的選擇題,也有復雜的需要解題過程的大題,非常適合測試AI。
張凱磊透露,在實驗階段,Aidam的最好成績是139分,平時的穩(wěn)定成績在120-130分。
學霸君首席科學家陳銳鋒在考試比賽現(xiàn)場表示,Aidam解題分為三大步驟:第一,把試卷題目變成機器可以理解的形式語言。第二,在用形式語言完整描述了一系列環(huán)境之后,計算機就會在知識網絡里啟動搜索,確認題目觸發(fā)了哪些知識點,然后進行一系列的推理,找出最佳解題路徑。第三,把解題的過程和答案,從形式語言轉化為自然語言,完成解題過程。
與Aidam不同,AI-MATHS是另一種思路。成都準星云學科技有限公司CEO、清華大學蘇州研究院大數(shù)據(jù)中心主任林輝向媒體表示,AI-MATHS則是通過綜合邏輯推理平臺來解題,而非學習儲存題庫,因此在完全掐斷題庫、斷網、無人干涉、僅有12臺服務器、1.2萬道題的小樣本訓練量的諸多限制下,AI-MATHS在今年2月份時取得了93分的成績。
任林輝透露,在今年2月之前,AI-MATHS僅有100套試題的訓練量,從2月開始,為了訓練AI-MATHS的答題速度,團隊加大了題量,目前AI-MATHS有500套試題的積累。
對比來說,可能AI-MATHS更接近人工智能復雜邏輯推理的自主學習方式。
智能AI的“短板”在閱讀理解
盡管AI機器人能在數(shù)學領域進展迅速,但距離成為學霸仍有一段道路。
智能教育機器人Aidam做高考數(shù)學題的同時,三組數(shù)學高考狀元在和它同臺PK。三組高考狀元得分分別為146分、140分、119分,Aidam為134分。三組高考狀元平均分135分,Aidam以一分之差惜敗。
AI-MATHS做2017年高考北京文科數(shù)學卷獲得105分,用時22分鐘;做2017年高考文科全國卷II則獲得100分,用時10分鐘。對于AI-MATHS的成績,準星云學CEO林輝曾在接受媒體采訪時表示,它失分的重要原因來源于“無法理解題意”。
今年1月,日本國立情報學研究所(NII)的研究人員宣布,放棄讓人工智能系統(tǒng)“Torobo-kun”參加東京大學入學考試的計劃。NII的Noriko Arai教授解釋道:“人工智能系統(tǒng)無法理解必要的信息,閱讀和理解句子含義的能力存在局限。我們發(fā)現(xiàn),現(xiàn)在還沒有辦法使這一系統(tǒng)獲得足夠的分數(shù),使它通過東京大學的入學考試?!?/p>
科大訊飛輪值總裁吳曉如認為,技術在不斷進步的同時,高考命題也在不斷進步?!艾F(xiàn)在高考的題目越來越靈活,越來越綜合性,所以這些題目的處理對機器來說越來越困難。我們現(xiàn)在也和一些考試機構的專家在一起溝通,發(fā)現(xiàn)他們在出這個題目的過程中,很多的題目就必須包含你人都有很多的一些理解,你要做很多中間一些邏輯性的轉換,才把一個題目能做得好?!?/p>
不過,智能AI正在迅速提高在文科方面的學習能力。此前微軟小冰在2017年5月19日出版的詩集《陽光失了玻璃窗》獲得好評,被認為已經有了很大的進步。
AI將會顛覆教育行業(yè)嗎?
吳曉如對媒體介紹,目前科大訊飛的智能閱卷產品,已經可以實現(xiàn)對主觀題,甚至對語文、英文的這樣一個作文題都可以實現(xiàn)自動的評分。AI會顛覆教育產業(yè)嗎?
有觀點認為,未來5-10年人工智能或將成為教育行業(yè)變革最重要的解決方案,推進智能化教育,構建以學習者為中心的教學模式,能夠改進傳統(tǒng)教育的不足,彌補傳統(tǒng)教育的短板。
不過陳銳鋒認為,AI還不能代替老師。因為,機器人沒法代替老師講解。比如,這道題為什么對,為什么錯,解題思路為什么這么想不對,為什么那樣想又是對的。但是,AI可以告訴老師,這個學生的哪些知識點有問題,哪些地方應該花更多的精力去訓練,而不是把時間浪費在該學生已經掌握的知識上。
張凱磊表示,中學期間大概有3529個考點、平均每個做3-4道題就夠了,寫1萬道題目可以做完,但目前絕大部分學生面對的練習題有3萬-4萬,其中3/4的題目是不需要寫的,75%的寶貴時間都被浪費掉了。
在傳統(tǒng)模式下,從學生寫作業(yè)到老師批改,再到學生改錯一般需要耗費2-3天的時間,引入AI后讓當天作業(yè)當天批改成為了可能。
據(jù)相關媒體報道,準星云學最早研發(fā)的產品“準星智能評測系統(tǒng)”,前端是一支智能筆,后端是人工智能系統(tǒng)。學生用這支筆答題的同時,系統(tǒng)將全程采集答題數(shù)據(jù),一鍵傳輸?shù)皆贫?,后臺系統(tǒng)對學生的學習力進行畫像。這種智能評測的方式可以幫助學生及時找出知識缺陷并提示進行針對性補習。
張凱磊接受媒體群訪時表示,實現(xiàn)個性化學習,大幅度提升學習效率和成果是學霸君研發(fā)智能教育機器人的初衷。“中國980萬的老師,差異性太大了,要讓980萬的老師整齊劃一,太難了。有沒有可能把這些能力移植到系統(tǒng)的層面,讓系統(tǒng)完成老師70%或者80%的行為呢?”
AI跨領域能力還不夠強
除了數(shù)學考試外,圍棋是人工智能占領的另一個高地。國際圍棋頂尖柯潔用“圍棋上帝”來形容谷歌(微博)旗下的人工智能Alphago。Alphago用3:0完勝的表現(xiàn),宣告自己成為了地球上圍棋水平最高的人。
從橫空出世到被中國棋院頒發(fā)職業(yè)九段認證,Alphago只用了7年的時間。
Aidam盡管沒能打敗昔日的高考數(shù)學狀元,但在10分中內交出134分的答卷足以讓人瞠目結舌。
在垂直細分領域,AI已經展現(xiàn)出不容小視的實力,可以預見的是未來會涌現(xiàn)出各種各樣的Alphago。海信的工廠里部分崗位就是用機器人來代替人工,提升效率的同時也降低了成本。不少行業(yè)的客服類業(yè)務已經引入了,基于深度學習、自然語言理解和情緒、情感識別技術的AI客服。
不過,目前的AI只能在細分領域獨當一面,創(chuàng)新工廠創(chuàng)始人李開復(微博)在接受媒體采訪時表示,跨領域的、高深的、需要深度思考的內容,未來十年人工智能也無法達到。
不少創(chuàng)業(yè)公司都將人工智能視為下一個風口,好像不管從事什么項目只要加上AI就能吸引投資。
招商致遠合伙人王盛指出,人工智能實際上是幾十年前就發(fā)生了,最近幾年比較熱是一些投資機構炒起來的。但是,人工智能是一個大趨勢的事情,短期內可能會有一些熱度的波動,但是未來十到二十年潛力巨大,而且應用的場景會越來越多。
據(jù)艾瑞咨詢預計,2020年全球人工智能市場規(guī)模將達到1190億元,年復合增速約19.7%;同期中國人工智能市場規(guī)模將達91億元,年復合增速超50%。
東方富海合伙人周紹軍認為,投資機構不會投概念,而是投落地的場景。未來的技術一定是要落地的,包括服務機器人、自動駕駛、無人機等,都是人工智能有可能落地的場景。