finance_playwright
自动化财务数据提取练手项目。使用playwright控制浏览器下载数据,虽然比requests慢,但通用性更好
安装部署
git clone --depth=1 https://github.com/wukan1986/finance_playwright.git
cd finance_playwright
uv venv
uv build
爬取方式一HTTP
通过解析HTTP请求返回的json数据,得到目标数据
- 获取的底层更原始数据,含有更多信息,保持了原始数据类型
- 开发工作量大,不同页面要分别处理
爬取方式二HTML
通过解析HTML网页DOM,得到目标数据
- 仅获取展示的界面,数字先变成了字符串,可能转不回数字
- 开发简单,通用性更高
代理池
可以为不同请求启用新的context,实现分别设置代理
context = await browser.new_context(proxy={"server": "http://127.0.0.1:10808"})
page = await context.new_page()On this page
Languages
JavaScript97.4%Python2.6%
Contributors
MIT License
Created February 6, 2026
Updated February 12, 2026