城邦自慢塾 零基礎入門網路爬蟲,開啟Python Coding之路 講師:李厚均 影音教學 中文發音 繁體中文版(DVD版)
一天只有24小時,資訊量卻每分每秒在爆量增加,資料蒐集與文字工作的負擔日漸不堪負荷,該如何在有效的時間內從龐大資料中快速取得有效的資訊加以利用呢?網路爬蟲絕對是最重要的技能之一。只要選對工具與程式語言,也能讓程式零經驗、想自動化蒐集資料的你快速上手實戰,減輕工作上的負擔!
上完課掌握哪些技能
- 快速從網頁擷取重要資訊。
- 掌握HTML、CSS、Javascript等網頁基礎知識。
- 運用Brautifilsoup & Regular Expression解析HTML。
- 學會觀察網頁中get/post封包,並有能力模擬封包。
誰適合上課
- 想寫程式卻不知道該選擇哪種語言。
- 懂程式語言,卻沒有學過Python的人。
- 想要快速掌握資料科學實務應用的人。
- 想轉行、想理財節省人工擷取資訊的人。
課程主要教學如何在資料海中快、狠、準的找到對自己有效的資訊並加以利用。課程設計四大單元、二十一個小節來手把手帶你學會如何用Python撰寫爬蟲,針對網頁爬取所需資訊,透過程式有效地蒐集網路上不同的金融數據並加以分析,是資料數據時代想要投資理財或從事相關行業不可或缺的能力。
單元一、網頁基礎原理
第一單元首先介紹網頁基礎原理,帶學員直接從現有網站觀察程式碼,解析網頁構成三大要件HTML、CSS、Javacript分別扮演的角色及實際功用,分析CSV、Json常見的資料儲存格式。
單元二、Python 基礎爬顆/strong>
第二單元開始進入網路爬蟲的世界,首先介紹伺服器與HTML的關係,於本機建置Anaconda、Jupyter的上課環境,透過網頁觀察get/post封包,並實際動手製作Python模仿get/post封包,以及如何使用Brautifilsoup & Regular Expression來解析HTML。
單元三、Python 爬蟲實務
具備網頁概念與基礎爬蟲技術之後,實務上會發現不是每個網頁都會乖乖地讓你爬取資訊。第三單元要教你如何爬取表格資料,更要帶您排除網站上的防護機制,例如閃避網頁驗證碼、大量爬取單一頁面資料、自動定時爬取資料等等,解決實務上常遇到的狀況。
單元四、儲存資料
前面單元已經學會如何爬取資料並儲存成CSV格式,第四單元則是要教大家透Pyhton內建的database SQLite將資料儲存在資料庫裏面,當未來有需要的時候就快速獲取資訊。
講師 Isaac 畢業於台大電子所,主要專長為人工智慧及資料分析,擅長處理影像辨識、金融數據等問題。他過去曾於多處擔任資料科學講師,同時,也曾在許多上市櫃公司擔任內訓講師及顧問,具有相當豐富的教學及實戰經驗。
目前為T客邦長期合作講師,開立過許多課程,如Python大數據爬蟲、金融大數據分析平台、AI人工智慧深度學習、Apache Spark大數據平台處理實務等課程。授課經驗豐富,累積學員數超過數百名,並有經營Facebook粉絲專頁-小李談數智,在社群提供更多關於人工智慧、深度學習的資訊。
經歷
AI人工智慧講師
台積電、中華電信等企業內訓AI講師
T客邦資深講師
Lab AI軟體工程師
學歷
台灣大學電子工程研究所碩士
美國伊利諾香檳分校交換學生
交通大學電子工程學系學士
著作
選擇的能力–探索人工智慧的核心
【作者簡介】
Isaac畢業於台大電子所,主要專長為人工智慧及資料分析,擅長處理影像辨識、金融數據等問題。
過去曾於多處擔任資料科學講師,同時,也曾在許多上市櫃公司擔任內訓講師及顧問,具有相當豐富的教學及實戰經驗。
詳細資料
規格:普通級
出版地:台灣
檔案格式:影片 (MP4)
作者:李厚均
出版公司:城邦自慢塾
出版日期:2020/02/03
語言:中文
時長:2小時54分
001_單元 1、為什麼需要網路爬蟲(05分11秒).mp4
002_單元 2、起手式:建置學習環境並開始看網頁原始碼(10分28秒).mp4
003_單元 3、看懂負責網頁內容架構的HTML(17分15秒).mp4
004_單元 4、看懂負責網頁外觀與排版的CSS(06分42秒).mp4
005_單元 5、看懂負責網頁互動機制的JavaScript(03分19秒).mp4
006_單元 6、儲存與傳輸資料的重要格式:CSV與Json(09分50秒).mp4
007_單元 7、跟伺服器溝通:Get封包介紹(17分42秒).mp4
008_單元 8、跟伺服器溝通:Post封包介紹(13分36秒).mp4
009_單元 9、用Anaconda建置Python開發環境(09分39秒).mp4
010_單元 10、用Get方法打造Python爬蟲(12分44秒).mp4
011_單元 11、用Post方法打造Python爬蟲(06分49秒).mp4
012_單元 12、用Beautifulsoup解析HTML(16分31秒).mp4
013_單元 13、用Regular Expression解析HTML(11分07秒).mp4
014_單元 14、混合運用Beautifulsoup和Regular Expression(04分23秒).mp4
015_單元 15、如何爬取下載網頁圖片(04分48秒).mp4
016_單元 16、如何爬取表格資料(04分16秒).mp4
017_單元 17、如何設定自動抓取網頁(03分08秒).mp4
018_單元 18、如何繞掉網頁驗證碼(04分17秒).mp4
019_單元 19、如何大量爬取單一頁面(04分33秒).mp4
020_單元 20、如何定時爬取網頁更新資訊(06分47秒).mp4
021_單元 21、使用SQLite資料儲存(09分05秒).mp4
022_零基礎入門網路爬蟲,開啟Python Coding之路_課程介紹(02分13秒).mp4