如何測試人工智能軟件?
這兩天圍棋人機大戰(zhàn)——阿法狗(阿爾法狗,AlphaGo)和李世石(暫時俗稱:小李子)之戰(zhàn)吸引了不少眼球,測試人員也不例外AI CS6怎么測試已經(jīng)做好的條碼文件是否正確。作為AI軟件的一個實例——阿法狗,小李子是最合格的測試工程師。如果阿法狗贏了小李子(實際到目前是完勝3:0),說明這款軟件是極其成功的,滿足谷歌(Google)公司的期望,完成了其高質(zhì)量的檢驗。如果阿法狗輸了,說明還有改進的空間,質(zhì)量有待提高,測試也發(fā)揮了作用,但也不能說明這款軟件質(zhì)量不合格,只是沒有達到一流水平,因為之前得到過相對較低水平的檢驗:即和歐洲冠軍的比賽,阿法狗5:0完勝人類專業(yè)棋手。 所以,對于AI軟件的測試,實際有一個時間維度,AI軟件隨著時間(不斷學(xué)習(xí))前移,其能力必須(快速)增強,和人類一樣,能夠不斷成長,這才是一款真正的AI軟件。AI軟件最初的測試,就是看它有沒有學(xué)習(xí)能力,本質(zhì)上,就是算法的驗證,即對啟發(fā)式算法(heuristic algorithm)、啟發(fā)式搜索算法(heuristic searchalgorithm)、元搜索算法(Meta-heuristicalgorithm)、強化學(xué)習(xí)和深度強化學(xué)習(xí)或具體的算法(如遺傳算法、模擬退火算法、神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、禁忌搜索、演化算法、蟻群算法)等中某些算法或算法的組合進行驗證。算法的驗證,主要是通過實驗進行(雖然也可以通過數(shù)學(xué)、模型等演化進行證明),借助大量數(shù)據(jù)進行普適性驗證。