即便有算力系統傍身,可是光有算力是不夠的。
算力只是計算的能力而已,沒有算法的加持,算力等于是零。
就好比:你不可能光靠著汽油去詩和遠方,你必須得有一輛汽車,然后那些汽油才能發揮作用。
而本就是本二水準的林遠對于算法一道并不精通。
其實這也很好理解。要是林遠天生聰慧,當年高考也就不會考個本二了。
因而林遠能拿到紫金航校計算機專業的面試資格全然是靠算力系統的指引。
是算力系統為他規劃好了學習路徑,找對了每一科的教材,才讓林遠的學習事半功倍。
所以,林遠不得不面對一個事實:其實他自己挺菜的。
畢竟智商這個東西吧,真不是看幾本書就能有啥質的提升。
-----------------
經過了兩分鐘后,林遠的古董T440總算開機完成。
如果這時候上面裝了630安全軟件,那一定會在右下角顯示:您的開機速度打敗了全國X%的用戶(X一定是個位數)。
依照慣例,林遠沒有在開機完成后的第一時間就點開他的python開發環境--pycharm。他又給了T440一分鐘時間“冷靜冷靜”。因為一臺古董機的真正開機完成往往并非如它所展示的那樣。
足足三分鐘后,pycharm的圖標終于被打開。
【loading project。。?!拷又氖驱斔俚募虞d過程。
隨后,林遠終于打開了他的OCR識別項目。
沒錯,他直接套用了現成的項目代碼。
這并非是他作弊。
事實上就在剛剛,張教授特地跑到每一個教室來說了一遍,“這次上機考核不同于以往,除了不允許交頭接耳抄襲代碼之外,隨便你們上網查閱資料。你們可以參考任何開源項目?!?/p>
張教授甚至貼心地把寫有校方WiFi名稱和密碼的白紙,用磁吸貼在了黑板上。
“但有一點。千萬不要自作聰明,別以為拿別人代碼改改我們就看不出來。我最近正在做一個用AI技術判定代碼抄襲的課題,但愿你們不要給我提供AI訓練的素材?!?/p>
既然連參考開源項目都不成問題,那直接套用個人過往項目自然更加不在話下。
不過所謂套用,卻遠非是簡單的復制黏貼。
在林遠看來,所有AI訓練的過程都可以被抽象為:采集數據==》訓練數據==》計算誤差==》回饋誤差。
雖然這次考核沒有解釋的太詳細,但是林遠憑借這半年來的刻苦學習已然完成了第一步--審題。
任何考試的第一步永遠是審題,很多所謂的難題往往審題占了很大的比重。
而以這間教室里不少人緊皺的眉頭來看,他們看樣子是連第一關都沒過。
考題是讓大家用原創方法實現OCR字符識別,但卻沒有詳細指定哪些范疇算是原創的。這是這次考核的第一道面紗。
如果真的從“數據采集”階段完全原創,那可以洗洗睡了。
林遠大致估算了下,如果從頭開始每一行代碼都是原創的,那今天大家就要留在這間教室過夜了。
可是他剛剛就有環顧四周,顯然校方沒打算留他們過夜。校方甚至沒打算留他們吃晚飯。
此刻的時間大致是下午兩點,那這次考核的時長也就是三四個小時。
林遠心道:‘這考核也太隨性了,鬼知道是哪個混蛋想出來的?!?/p>
既然考核只有三四個小時,那考核必然有考察的重點。
林遠仔細思索了一小會兒。
對于OCR字符識別來說,采集數據特征完全就是公式化的步驟。因為OCR識別不是什么新的領域,那必然就不可能是考核的重點。所以,這部分代碼,抄就完事兒了。
剩下的計算誤差和回饋誤差,也沒什么可創新的。更準確來說,校方這整的是研究生入學考核,又不是招募國寶級科學家,難道還指望通過這次考核發現什么天才?
所以,這次考核的重點,必然是聚焦于考察考生平日里的修行。
簡單來說,就是考察你平時都在干些什么。對計算機和AI到底感不感興趣啊。如果你感興趣,那你就肯定會經常寫寫代碼。經常寫寫代碼那自然就會很熟練。
而興趣是科研的首要條件。
雖然林遠此時并沒有對科研報以很大的興趣,但是他對通過走科研一途改變命運很有興趣。
嗯~~,也算是殊途同歸吧。
既然要考核平日修行,又不指望你水平能有多高。那自然也就不可能去考核計算誤差和回饋誤差這兩個步驟,因為這兩個步驟有太多現成的套路方案,體現不出人與人的差異性。
那就只剩最后一個步驟--訓練數據。
這個步驟綜合了線性代數、微積分、計算機編程能力、圖像學,算是很綜合的一個步驟。
‘一定是這樣的?!诌h思慮既定,當即快速定位到原有項目工程中“訓練數據”部分的代碼。他打算重構這部分代碼,至于其它部分的嘛,就原封不動了。
林遠接著深入思考。
現今的AI訓練無非就是基于深度神經網絡,但是總共也就才三個多小時,既要寫代碼又要調試出結果,根本就不可能把網絡設計的有多深。
而在了解圖像基本原理,掌握線性代數和微積分的基礎上,如果用現成的數學計算工具庫。比如:tensorFlow或者pytorch搭建一個三層左右的神經網絡。三個小時時間夠好差不多。
至此,林遠恍然了。
‘審題結束。原來就是一道綜合考查題。出題人挺壞的,算是把應試的人徹底篩出去了。名校的研究生入學考試,果然不是光靠做題就行的?!?/p>
得益于往日里對OCR識別項目的了解,林遠自信兩小時就能完成代碼編寫和調試。
可麻煩的是這臺T440沒法用GPU訓練。
現代的AI訓練用數學工具庫需要的硬件入門條件太高,林遠無奈只得轉而用CPU跑訓練。
他并未因此有什么擔憂,因為訓練的過程是持續的。只要訓練出的結果誤差在不斷縮小,那即便時間上來不及,也能通過展示出來的潛力來讓老師們同意延長時間。
這就好比在爬山的時候,雖然還沒有看到云遮霧繞的山頂,但通過腳底的感受就能清晰知道:此刻所處的地方并非是山頂,上面還有更高的地方。
由于這次考核的參試者每個人的筆記本性能都是不一樣的,因此林遠篤定:考核的重點決對不會是訓練時間的長短,而是最終訓練結果的準確率。
也就是說:這次考核不是考你爬的有多快,而是考你最后能爬的多高。
念及于此,林遠不自禁嘴角一笑,‘難怪剛剛那個張教授一直強調的是結果的準確率?!?/p>
他的推測和張教授起初公布的評判結果完美匹配上了。
思慮既定,林遠隨即開始了忙碌的復制+黏貼。
更新時間:2024-11-26 09:14:40