微軟 Azure 雲端倡導者很高興提供一個為期 10 週、共 20 課的數據科學課程。每課包含課前和課後小測驗、書面指引來完成課程、解決方案和一個作業。我們基於專案的教學法讓你一邊學習一邊實作,是培養新技能的有效方法。
衷心感謝我們的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審查員與內容貢獻者, 特別是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha、Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| Data Science For Beginners - Sketchnote by @nitya |
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
偏好本地克隆?
此倉庫包含 50 多種語言的翻譯,會大幅增加下載大小。要跳過翻譯只克隆核心資料,請使用稀疏檢出:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"這樣能以更快的速度獲得完成課程所需的所有內容。
如果你希望支持更多翻譯語言,請參考 此處
我們有一系列持續進行的 Discord AI 學習活動,9 月 18 日至 30 日加入 Learn with AI Series ,獲取使用 GitHub Copilot 作數據科學的秘訣和技巧。
可以從以下資源開始:
- 學生中心頁面 在此頁面,你會找到初學者資源、學生包甚至取得免費認證券的方法。這是一個值得收藏並定期查看的頁面,因為我們每月至少調整一次內容。
- Microsoft Learn 學生大使 加入全球學生大使社群,這可能是你進入微軟的一條途徑。
完全初學者:剛接觸數據科學?請先看我們的初學者範例!這些簡單且註解詳盡的範例將幫助你理解基礎,然後再深入整個課程。 學生:若想自行使用此課綱,請分支整個倉庫,從課前測驗開始自行完成練習。閱讀課文,完成其他活動。嘗試藉由理解課程內容來完成專案,不要直接複製解決方案程式碼;不過每個專案課的 /solutions 資料夾中都有程式碼可供參考。另一個建議是跟同學組成讀書會一起學習。欲深入進修,我們推薦 Microsoft Learn。
快速入門:
- 參考 安裝指南 設定環境
- 閱讀 使用指南 學習如何使用課程
- 從第一課開始依序學習
- 加入我們的 Discord 社群 獲得協助
教師們:我們已經包含了一些使用本課程的建議。歡迎您在討論區提供寶貴意見!
動圖製作者 Mohit Jaisal
🎥 點擊上方圖片觀看有關本專案及其創建者的影片!
我們在構建本課程時選定了兩個教學原則:確保課程以專案為基礎,並且包含頻繁的測驗。到本系列課程結束時,學生將學會資料科學的基本原則,包括倫理概念、資料準備、不同的資料操作方法、資料視覺化、資料分析、資料科學的實際案例,等等。
此外,課前的低壓力測驗能使學生對學習主題設立目標,而課後第二次測驗則確保進一步的知識保留。該課程設計靈活且有趣,可整體參與或部分學習。專案從簡單開始,經過10週的課程循環逐漸變得複雜。
- 可選素描筆記
- 可選補充影片
- 課前暖身測驗
- 書面教學內容
- 對於專案課,提供逐步的專案製作指南
- 知識檢查
- 挑戰題
- 補充閱讀材料
- 作業
- 課後測驗
關於測驗的小提醒:所有測驗皆存在 Quiz-App 資料夾中,總共40組測驗,每組3題。測驗連結嵌入於課程內,但可在本機執行或部署至 Azure;請參考
quiz-app資料夾中的教學。測驗正在逐步本地化。
剛接觸資料科學? 我們建立了特別的範例目錄,內含簡單且有詳細註解的程式碼,幫助你入門:
- 🌟 Hello World - 你的第一個資料科學程式
- 📂 載入資料 - 學習讀取與探索資料集
- 📊 簡單分析 - 計算統計數據並尋找模式
- 📈 基礎視覺化 - 製作圖表與圖形
- 🔬 實務專案 - 從開始到完成的完整流程
每個範例均有詳細註解,說明每一步,非常適合完全新手!
👉 從範例開始 👈
![]() |
|---|
| 資料科學初學者:路線圖 - 素描筆記作者 @nitya |
| 課程編號 | 主題 | 課程群組 | 學習目標 | 連結課程 | 作者 |
|---|---|---|---|---|---|
| 01 | 資料科學定義 | 介紹 | 學習資料科學的基本概念及其與人工智慧、機器學習與大數據的關聯。 | 課程 影片 | Dmitry |
| 02 | 資料科學倫理 | 介紹 | 資料倫理的概念、挑戰與架構。 | 課程 | Nitya |
| 03 | 資料定義 | 介紹 | 資料的分類方式及常見來源。 | 課程 | Jasmine |
| 04 | 統計與機率導論 | 介紹 | 運用機率與統計的數學技巧來理解資料。 | 課程 影片 | Dmitry |
| 05 | 處理關聯式資料 | 資料操作 | 介紹關聯式資料與使用結構化查詢語言 (SQL,發音為“see-quell”) 探索及分析致關資料的基礎。 | 課程 | Christopher |
| 06 | 處理 NoSQL 資料 | 資料操作 | 介紹非關聯式資料、其各種類型,以及探索和分析文件資料庫的基礎。 | 課程 | Jasmine |
| 07 | 使用 Python | 資料操作 | 使用 Pandas 等函式庫,基礎的 Python 資料探索操作。建議具備 Python 程式基礎知識。 | 課程 影片 | Dmitry |
| 08 | 資料準備 | 資料操作 | 涵蓋資料清理和轉換技巧,以應對資料缺失、不準確或不完整的挑戰。 | 課程 | Jasmine |
| 09 | 量的視覺化 | 資料視覺化 | 學習如何用 Matplotlib 視覺化鳥類資料 🦆 | 課程 | Jen |
| 10 | 資料分布視覺化 | 資料視覺化 | 視覺化區間內的觀察和趨勢。 | 課程 | Jen |
| 11 | 比例視覺化 | 資料視覺化 | 視覺化離散和分組百分比。 | 課程 | Jen |
| 12 | 關係視覺化 | 資料視覺化 | 視覺化資料集合及變數間的連結和相關性。 | 課程 | Jen |
| 13 | 有意義的視覺化 | 資料視覺化 | 製作有效解決問題及洞見的重要視覺化技術與指導。 | 課程 | Jen |
| 14 | 資料科學生命週期導論 | 生命週期 | 介紹資料科學生命週期及其第一步:取得與擷取資料。 | 課程 | Jasmine |
| 15 | 分析階段 | 生命週期 | 本階段聚焦於資料分析技巧。 | 課程 | Jasmine |
| 16 | 溝通階段 | 生命週期 | 本階段聚焦於以方便決策者理解的方式呈現資料洞見。 | 課程 | Jalen |
| 17 | 雲端資料科學 | 雲端資料 | 介紹雲端資料科學及其優勢。 | 課程 | Tiffany 和 Maud |
| 18 | 雲端資料科學 | 雲端資料 | 使用低代碼工具訓練模型。 | 課程 | Tiffany 和 Maud |
| 19 | 雲端資料科學 | 雲端資料 | 使用 Azure Machine Learning Studio 部署模型。 | 課程 | Tiffany 和 Maud |
| 20 | 實務資料科學 | 實務應用 | 真實世界中由資料科學所推動的專案。 | 課程 | Nitya |
按照以下步驟在 Codespace 開啟此範例:
- 點擊 Code 下拉選單並選擇 Open with Codespaces 選項。
- 在窗格底部選取 + New codespace。 更多資訊請查看GitHub 文件。
使用本機電腦與 VSCode 的「遠端 - 容器 (Remote - Containers)」擴充,按照以下步驟在容器中開啟此倉庫:
- 若是首次使用開發容器,請確保系統符合先決條件(例如已安裝Docker),詳見入門文件。
使用此倉庫有兩種方式:
開啟倉庫至獨立的 Docker 卷:
注意:此舉使用 Remote-Containers 的「Clone Repository in Container Volume...」指令,將原始碼克隆至 Docker 卷,而非本地檔案系統。卷 (Volumes) 是持久化容器資料的首選機制。
或開啟本地克隆或下載的版本:
- 將此倉庫克隆到本地檔案系統。
- 按 F1,選擇 Remote-Containers: Open Folder in Container... 指令。
- 選擇剛克隆的資料夾,等待容器啟動後開始使用。
可使用 Docsify 離線瀏覽本文件。將本倉庫 fork 下來,於本地安裝 Docsify,然後在本倉庫根目錄執行 docsify serve。網站將在本地端口 3000 提供服務:localhost:3000。
注意,Notebook 無法透過 Docsify 渲染,如需執行 Notebook,請在 VS Code 中使用 Python kernel 分別操作。
我們團隊還開發其他課程!請參考:
遇到問題? 查看我們的 故障排除指南 以獲得常見問題的解決方案。
如果你在構建人工智能應用程序時遇到困難或有任何疑問,歡迎加入用戶及經驗豐富的開發者一同參與 MCP 的討論。這是一個支持性強的社群,問題隨時歡迎,知識自由分享。
如果你在開發過程中有產品反饋或錯誤,請訪問:
免責聲明:
本文件是使用 AI 翻譯服務 Co-op Translator 進行翻譯。儘管我們努力追求準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應視為權威來源。對於重要資訊,建議採用專業人工翻譯。我們不對因使用本翻譯而引起的任何誤解或誤釋負責。



