职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
1.熟练掌握Python编程语言,熟悉爬虫框架(如Scrapy),能够编写高效、稳定、可扩展的爬虫程序。
2.熟练掌握网络协议(HTTP/HTTPS)和网页解析技术(如XPath、CSS Selector、正则表达式),能够实现对目标网站进行数据爬取和解析。
3.了解分布式爬虫技术和反爬虫策略,具备一定的反爬虫能力。
4.熟悉数据库技术,例如MySQL、Oracle、MongoDB等,能够完成数据的存储、清洗和分析。
5.有较强的学习能力和团队协作能力,能够快速适应新的技术和环境,与其他开发人员协作完成项目。
6.有较强的数据观察能力和分析能力,能够将爬取到的数据进行清洗、整理、分析和可视化。
职责通常:
1.负责设计和实现针对特定网站的爬虫程序,确保数据的有效、高效地爬取;
2.理解并分析目标网站的数据结构,设计合适的爬虫策略与算法;
3.进行数据清洗和处理以及存储,确保爬取到的数据的完整性、准确性和可用性;
4.不断调优爬虫程序,提高效率和鲁棒性;
5.协作开发人员完成数据分析和可视化等任务,满足业务需求。
工作地点
地址:成都武侯区成都-高新区成都博智维讯信息技术股份有限公司
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
成都博智维讯信息技术股份有限公司
- 计算机软件
- 200-499人
- 公司性质未知
- 软件园c区