一个面向开发者的 GitHub 数据分析工具,
支持从用户维度进行数据采集与开发者画像分析,
帮助快速洞察技术栈、活跃度与项目影响力。
- 无需复杂配置,开箱即用
- 支持免登录与 Token 双模式
- 一键生成开发者画像分析
- 本地运行,数据可控
https://goku-dev-scraper.streamlit.app/
https://modelscope.cn/studios/GokuScrpaer/GokuGitHubScraper
- 免登录 / Token 双模式
- 基础信息采集
- 仓库信息采集
- Commit 信息采集(支持仓库数量与分页上限控制)
- 开发者画像分析:
- 技术栈分布
- Star 与活跃度
- 开发峰值
- 存储占用
- 仓库影响力评分
- 许可证合规分布
streamlit_app.py:主应用start_ui.py:启动入口requirements.txt:依赖清单logo.svg/gzh.jpg:界面资源文件
- Python 3.10+(推荐 3.11)
- Windows
pip install -r requirements.txtpython start_ui.pystreamlit run streamlit_app.py启动后默认访问:
- 在“配置与额度检查”页输入 GitHub 用户名或主页 URL。
- 选择运行模式:
- 免登录(额度较低)
- Token(额度更高)
- 执行额度检查并通过校验。
- 按页签顺序执行:
- 基础信息采集
- 仓库信息采集
- commit 信息采集
- 开发者画像分析
- 下载 CSV 或保存到导出目录。
在线体验工具,或了解更多数据分析能力。
如有定制化数据分析或工具需求,欢迎交流。
- 启动后无界面:请确认浏览器是否打开
http://localhost:8501。
本项目为数据分析与可视化工具,仅处理公开数据用于研究分析。
本项目与任何第三方平台无关联或授权关系。
禁止用于任何违法或侵犯他人权益的用途,使用者需自行承担全部责任。

