如果出现文字缺失,格式混乱请取消转码/退出阅读模式
之所以選擇學校的機房,主要是因為python語言編寫的程序主要都是在Linux系統下運行,直接在Linux環境下學習python語言可以説是一舉兩得。
而陸舟自己的二手筆記本實在太垃圾了,論文轉個PDF格式都得假死一會兒,玩個擼啊擼別人都開始對線了他才站上泉水,裝雙系統或者虛擬機這些騷作是不用想的。
“雖然書上都講得很清楚了,沒想到這玩意兒用起來這麼麻煩……果然紙上的東西和實際作起來完全是兩回事,想學到東西還是得靠實踐啊。”第一次使用Linux系統的陸舟只
覺兩眼抓瞎,照着從圖書館借來的説明教程看了好一會兒,才算是摸清楚了門道。
不得不説,別人windows系統佔據這麼大的市場份額還是有道理的,全圖型的作系統即便是完全沒碰過電腦的小白,也能很輕鬆的上手。
然而Linux系統卻不一樣,基本上是命令行作模式,通過鍵盤就能完成一切
作。也幸虧學校裝的是帶有桌面環境的發行版,要不陸舟還真不知道鼠標這玩意兒有啥用。
當然了,Linux的優點也很明顯,超強的可定製和安全
使得它比windows系統更適合服務器等領域。而且一旦
悉了命令行
作,效率將比windows系統高個數倍不止。所以很多企業在招聘服務器前後端程序員的時候都會問一句,會不會用Linux系統。
悉了Linux系統的基本
作,陸舟打開了python軟件,翻開了書本,坐在電腦面前發呆。
“説到python的運用之一就是編寫網絡爬蟲,想要檢驗學習成果的話,從這個開始是最好的……可是做個什麼爬蟲呢?”陸舟不陷入了沉思。
爬微博上的博文?
爬貼吧的帖子?
好像無聊的。
關鍵是爬下來的數據拿在手上沒用,多了連放的地方都沒有。
忽然,他心中一動,不知怎麼的就回憶起了每次回家痛苦的搶票經歷。倒不是因為他電腦卡,而是因為鐵道部官網的UI設計實在是太反人類了。
“用爬蟲技術爬取12306網站的各車站、車次、餘票數據信息……這個好像可以搞啊。”一想到這裏,陸舟也不再磨蹭了,立刻開始幹活。
畢竟作為python語言的一種典型運用範例,爬蟲程序的模板在書中都是有提到的,而且針對不同種情況,書中還針對算法進行了不同程度的改良。
當然了,12306畢竟不是一般BBS論壇,把這個作為初學者的練習目標,還是有不小難度的。
不過也僅僅是不小而已,對於已經吃透了整本書的陸學霸來説,問題卻是不大。爬蟲本身並沒有太高的技術難度,不到30行代碼就搞定了整個程序,完美運行無BUG。
然後緊接着就是抓取了。
將網站的url複製在代碼後面,陸舟選擇運行,並且將數據生成表格,導入到預先建好的文件夾中。
緊接着機箱的風扇開始嗡嗡作響,電腦變的卡頓起來,一行行編碼從黑的對話框中閃過,被迅速整理進表格中。