亚洲精品中文免费|亚洲日韩中文字幕制服|久久精品亚洲免费|一本之道久久免费

      
      

            <dl id="hur0q"><div id="hur0q"></div></dl>

                利用Python來配合Google來收集信息

                大家都知道,在進行滲透測試最重要的一個環(huán)節(jié)就是信息收集。說到信息收集怎么能不讓能聯(lián)想到谷歌以及谷歌語法呢?如果是人工的搜索并且提取相關信息無疑是一個工作量很大的一個事情。并且也是相當浪費時間的一個事情。那么我們如何快速地去除一些重復性工作呢?通過代碼語言無疑是我們一個很好的選擇,接下來我將介紹使用Python3 + Selenium + pymysql + Google來完成這樣一個重復性任務。下面我們將以提取站點域名以及URL為例。

                首先我先介紹一下Selenium庫以及pymysql是什么?Python3 以及Google我就不贅述了。簡單地說明一下,selenium 是一個用于Web應用程序測試的工具。Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。那么我們可以利用該庫去操作WEB瀏覽器。pymysql 是python3當中操控數(shù)據(jù)庫的一個組件。

                下面我們來分析,我們需要利用Selenium來自動運行WEB瀏覽器。我們需要在瀏覽器上做什么樣的操作呢?輸入谷歌url,在谷歌搜索欄輸入谷歌語法,然后提取我們需要的內容。對不對?好的,那么我們腦子里面已經(jīng)有了一個初步的概念。接下來,我們需要做的是告訴Selenium我們的想法,并且它需要做的事情。接下來,我們來看下面的代碼:

                #提取數(shù)據(jù)class driver_1(object): def __init__(self): self.driver = webdriver.Chrome(‘D:chromedriver_win32chromedriver.exe’) #訪問谷歌,搜索信息 def logload_Chrome(self,search): self.driver.get(‘https://www.google.com/’) #定位搜索欄位置 Search = self.driver.find_element_by_name(‘q’) self.driver.implicitly_wait(30) Search.send_keys(search) Search.send_keys(Keys.ENTER) #提取站點信息 def Search_site(self,site,num): dict_name_url = {} now_site = ‘site:’ + ”’ + site + ”’ self.logload_Chrome(now_site) #提取url和name for a in range(0,num): if a > 0 and a a[href]’) i = 0 while i a[href]’) i = 0 while i < len(Result_name): dict_name_url[str(Result_name[i].text)] = str(Result_url[i].get_attribute('href')) i += 1 return dict_name_url

                上述代碼的作用是:登錄谷歌并且輸入搜索內容,并且通過循環(huán)來提取Google搜索出來的內容。

                當我們順利地提取出內容的時候就可以將內容放入數(shù)據(jù)庫。這個時候,我們需要利用到pymysql庫。通過它我們可以操控數(shù)據(jù)庫。詳細情況請看下面代碼:

                #保存數(shù)據(jù)信息class Save_to_DB(object): #鏈接出入數(shù)據(jù) def connect(self,i,key,value): conn = pymysql.connect( host = ‘localhost’, user = ‘root’, password = ‘Password@2020’, database = ‘suda’ ) #創(chuàng)建游標對象 cursor = conn.cursor() try: cursor.execute(“insert into information_site_suda values(%s,’%s’,’%s’);” %(int(i),key,value)) conn.commit() conn.close() except: conn.ping() cursor = conn.cursor() cursor.execute(“insert into information_site values(%s,’%s’,’%s’);” % (int(i), key, value)) conn.commit() conn.close()

                上述代碼的作用是將查詢出來的數(shù)據(jù)存放入數(shù)據(jù)庫當中。

                既然功能模塊已經(jīng)實現(xiàn),接下來就是調用了。詳細代碼可以查看附件(注意:中的一些部分需要修改才能運行,不如,MYSQL數(shù)據(jù)庫名等等)。該文章或許一些人看不懂。沒有關系,文章當中的模塊可以自己學習并不難。主要是希望各位了解到盡量不要去做重復性的勞動。學會利用工具。我一直認為代碼功底是區(qū)分腳本小子和大牛的分水線。請各位一起加油?。?!

                鄭重聲明:本文內容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權歸原作者所有,如有侵權請聯(lián)系管理員(admin#wlmqw.com)刪除。
                用戶投稿
                上一篇 2022年6月13日 06:10
                下一篇 2022年6月13日 06:10

                相關推薦

                • 破案了!李鐵被帶走細節(jié)曝光,始作俑者是武漢卓爾

                  前幾天,前國家隊主帥李鐵突然被帶走的事情引發(fā)了球迷們的熱議,針對這個事情,外界的猜測有很多個版本,而這其中媒體人冉雄飛的說法可能是最為權威的。現(xiàn)在他針對這個事情繼續(xù)進行爆料,透露了…

                  2022年11月27日
                • 短視頻策劃內容的3個要點(短視頻策劃內容怎么做)

                  短視頻在制作時,內容框架非常重要。如果直奔主題,然后結束,聚卓告訴你,這樣的短視頻已經(jīng)過時了?,F(xiàn)在的短視頻需要框架的,但不是任何框架,它需要一種易于理解和消化的框架。而且,現(xiàn)在大多…

                  2022年11月27日
                • 計算機網(wǎng)絡技術論文(計算機網(wǎng)絡技術論文七千字)

                  今天小編給各位分享計算機網(wǎng)絡技術論文的知識,其中也會對計算機網(wǎng)絡技術論文七千字進行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關注本站,現(xiàn)在開始吧! 計算機網(wǎng)絡方面的論文3000字…

                  2022年11月26日
                • 卿卿日常暗殺嫡長主的兇手是誰 幕后兇手有什么目的解析

                  《卿卿日?!氛跓岵ブ?,該劇唯一一對觀眾不看好的情侶,就是嫡長主和郝葭,那么暗殺嫡長主的兇手是誰?兇手有什么目的?下面一起來了解下吧! 卿卿日常暗殺嫡長主的兇手是誰 平時嫡長主在朝…

                  2022年11月25日
                • 小紅書平臺的一些機制及玩法詳解(小紅書玩法有哪些)

                  關于小紅書 一:小紅書平臺的一些機制 1. 筆記內容的CES評分機制 2. 筆記流量入口與長尾效應 二:小紅書優(yōu)質筆記的特點(分維度、類型分析) 1.筆記的本身架構組成 維度 2.…

                  2022年11月25日
                • 什么是推廣cpa一篇文章帶你看懂CPA推廣渠道

                  CPA渠道 CPA指的是按照指定的行為結算,可以是搜索,可以是注冊,可以是激活,可以是搜索下載激活,可以是綁卡,實名認證,可以是付費,可以是瀏覽等等。甲乙雙方可以根據(jù)自己的情況來定…

                  2022年11月25日
                • 博客營銷的3大優(yōu)勢解析(博客營銷怎么做)

                  不知不覺已經(jīng)寫了24篇文章,加上這篇是第25篇了,都是自己這幾年來用過的營銷方法,如果遇到有些不懂的,我會咨詢我的朋友和同事幫忙,盡量讓每一篇有價值,哪怕是對大家有一點點幫助也行,…

                  2022年11月25日
                • 什么是內容營銷策略如何策劃一套成功的內容營銷策略

                  很多時候,營銷人員會在創(chuàng)作營銷內容時感到沮喪,這也是很多企業(yè)至今沒用好數(shù)字化營銷工具的重要原因之一。 舉個例子,您可能會花上數(shù)小時期待制作一些令人驚嘆的東西,實際卻是得到很少的受眾…

                  2022年11月25日
                • 直播帶貨詳細腳本(直播文案策劃怎么寫)

                  短視頻運營策劃方案怎么寫?涉及哪幾個方面? 我在網(wǎng)上看到好多千篇一律的文章,關于【短視頻運營策劃方案】這一塊,基本都是在講賬號的內容本身。 你內容做得再好,卻不掌握算法的規(guī)律,能有…

                  2022年11月25日
                • 閑魚上怎么賣東西快?閑魚賺錢必知技巧(怎么在閑魚里面賣東西)

                  自從閑魚這個平臺出現(xiàn)以后,隨著這些年的發(fā)展,閑魚也成為了很多人開店賺錢的重要途徑。一些新人也想在閑魚上試試水,看看能不能賺到錢。如今閑魚上既可以賣二手閑置物品,也可以賣一些新品,那…

                  2022年11月25日

                聯(lián)系我們

                聯(lián)系郵箱:admin#wlmqw.com
                工作時間:周一至周五,10:30-18:30,節(jié)假日休息