google sheet的应用其实很强大,不要简单理解为只是在线文档。但是很多人连google如何打开都不稳定就别谈深度应用了。事实上Sheets 在电子表格市场上与 Microsoft Excel 竞争,但它的功能广度或深度不同。
谷歌表格可用于从网站上抓取数据、创建半自动化的 SEO 工作流程、操作大数据集、自动化外展活动的后续行动等等。
比如我最近用于群发邮件,只要输入邮箱,对应名字,就可以一键群发几万封,适合已知客户的通知类邮件,但不适合群发陌生开发信。
留着给你们自己研究了,这篇文章主要整理一下最近第三期询盘打卡的作业,进行延伸的分享。如果你像我一样不熟悉google语法公式,就直接跳过下载附件就可以傻瓜式用了。见文末尾
必备环境:你得能上google,找到google在线文档
应用场景:假设你正在处理相当大量的网站数据。
从 URL 列表中抓取元数据(例如标题、描述、h-tags 等);
从网页中抓取电子邮件地址;
从网页中抓取社交资料(例如 Facebook);
以下是一些可能有用的 XPath 公式:
提取页面上的所有链接
"//@href":
提取页面上的所有内部链接
"//a[contains(@href, 'domain.com')]/@href"
提取页面上的所有外部链接
"//a[not(contains(@href, 'domain.com'))]/@href"
提取 H1:
"//h1"
从页面中提取电子邮件地址:
"//a[contains(@href, 'mailTo:') or contains(@href, 'mailto:')]/@href"
提取社交资料(即LinkedIn、Facebook、Twitter)
"//a[contains(@href, 'linkedin.com/in') or contains(@href, 'twitter.com/') or contains(@href, 'facebook.com/')]/@href"

对自己知识的巩固,通过一次互动交流的方式,对一知识点重复再重复,加强记忆。同时也是对自己知识覆盖面知识网格的一次增加机会。如果对你有所帮助,群里找我一起交流哈哈。我在TONY的好多群里等你。因为我这个表格还没用得很666,比如说facebook怎么一键提取1000个不同页面的邮箱呢?有没有高手顺便帮我解决一下!!