• <bdo id="1ftk3"></bdo>
      <bdo id="1ftk3"></bdo>

      1. 歡迎來到合肥浪訊網絡科技有限公司官網
          咨詢服務熱線:400-099-8848

        谷歌“Excel”好強:不用自己寫代碼就能爬蟲,網友問微軟慌不慌

        發布時間:2022-10-20 文章來源:本站  瀏覽次數:1994

        家人們,要爬蟲——現在用一個電子表格就行了。

        一行代碼也別寫,第三方軟件也甭安。

        只需在表格里點幾下就ok。

        不信,你瞧:

        就這么兩下,網頁上的產品信息都有了。

        網友看完都驚呆了,碼個不斷。


        一看到這是來自谷歌的產品(Google Sheet,谷歌的“Excel”),大家就立馬cue起了微軟,問它慌不慌。

        還有人稱這是在“跨界打擊”它。 (手動狗頭)

        好不熱鬧。

        來看具體怎么實現。

        具體過程

        以爬亞馬遜某個手機產品的產品頁為例。

        咱們先翻開谷歌Sheet(網友版即可),新建一個文檔。

        然后copy一下要爬的網址,粘進去。

        剩下的都在Sheet里完成。

        咱們先列一下要爬的元素,這兒依次為:

        產品圖片-識別碼(asin,亞馬遜給每個產品生成的唯一標識)-產品名-價格-評分-圖片網址。

        然后就能夠正式開端爬了。

        要訣便是一個叫做ImportFromWeb的函數。

        它也是個插件,沒有的需求先裝置一下(裝置地址放文末端),然后通過Google Sheet程序的“擴展程序”菜單導入就行。

        咱們只需把ImportFromWeb函數放進asin那一列,然后第一個參數選中剛剛粘過來的網址,第二個參數把要爬的元素單元格拖一遍(除了“圖片”)。

        稍等個1~2s,價格、產品名等信息就都出來了!

        還差圖片。

        簡單~基操~

        用IMAGE函數把G3格子里得到的圖片網址值給曩昔就行。


        至此,第一個產品頁里的東西就爬到了。

        唯一麻煩的是,假如還需求爬更多產品的信息,需求把產品網址挨個粘一遍。

        然后就沒啥了,除了給單元格地址的行標列標加一下絕對引用符“$”。

        這兒能夠不學視頻,直接一個f4就行。

        拖一下,全部搞定!

        怎么樣?是不是非常方便。


        看完整個操作,你也發現了,其實便是谷歌寫了個腳本給咱封裝好了直接用。

        而據官方介紹,這個ImportFromWeb功能還能自動更新爬取到的信息。

        并且只要是用JS寫的網站都能夠爬(根本等于絕大數網站了),每個函數還可支持50個url,以及數千個數據點。

        上一條:年薪15萬美元的亞馬遜工...

        下一條:360周鴻祎:應該樹立國...

      2. <bdo id="1ftk3"></bdo>
          <bdo id="1ftk3"></bdo>

          1. {关键词}