㈠ 有沒有好的文章採集軟體推薦啊最近要採集大量數據,老是人手採集不科學啊。最好操作簡單易懂的。
最近用過「forespider」,只是採集文章的話這個挺好的,鏈接粘一粘,建個數據表就能采了,還挺快的。樓主可以看看,教程官-網也有。
㈡ 問下高手 ,自助建站用什麼文章採集軟體好啊最好是在我指定的網站收集
狂采大師採集軟體,功能強大,安全高效
《Internet狂采大師》是一款支持多任務、多線程的互聯網信息採集系統,通過靈活的規則可以從任何類型的網站採集信息,如新聞網站、論壇、博客、電子商務網站、招聘網站等等;支持網站登錄採集、POST採集、腳本頁面採集、動態頁面採集等高級採集功能;高級版支持樹形多分支採集、XPATH可視化採集;擁有詳細的日誌系統、功能強大的調度系統等等。
軟體功能特點:
1、 多任務 & 多線程,可以同時執行多個採集任務,每個任務又可以使用多個線程;
2、 功能設計簡潔容易上手,所見即所得,所采即可見;
3、 採集功能強大,可以採集新聞網站、論壇、博客、電子商務網站、招聘網站等海量數據採集;
4、 支持多種編碼:UTF8、UNICODE、GBK等,軟體會自動轉換;
5、 支持多種站點類型:包括HTML、AJAX等;
6、 支持登陸、驗證後採集;
7、 支持POST網址捕獲,可以輕松採集以POST方式提交的網站;
8、 支持URL樹形多分支導航,一個任務輕松採集論壇多個版塊(目前同類軟體具有此功能的極其少);
9、 採集任務可以進行分類,採用樹型目錄管理;
10、支持關鍵字採集,直接輸入關鍵字,一步設置;
11、支持增量採集,適用於短時間內對論壇,博客進行增量更新;
12、支持斷點採集,不用擔心斷電或軟體錯誤而使得任務中斷(此功能區別於其他同類軟體的優勢在於:真正實現斷點採集,伺服器重新啟動後照樣可以繼續採集 <注意:是接著伺服器關機前的狀態進行繼續採集,而非暫停後的繼續>);
13、秒級任務調度,管理任務更加智能,當有大量任務同時運行時,可以分批、排隊;
14、批量任務管理,支持批量導入、導出/啟動、停止;
15、XPATH可視化採集已遙遙領先於市面其他採集軟體;
16、採集結果自動排重,同時可以對採集結果進行篩選和處理;
17、完全結構化抽取,數據保存到本地,多資料庫支持,包括ACCESS、 SQL Server、 My Sql、Oracle;
18、軟體運行穩定,採集速度快,佔用資源少,支持數百個任務並發穩定地運行。
㈢ 偽原創軟體,哪裡有自動採集更新網站,偽原創文章工具
現在不錯的也就是亞普了!!
不能發鏈接了
----------------------------------------------------------
把滑鼠放到我的名字上就能看到最新的地址
----------------------------------------------------------
㈣ 如何實現網站文章的自動採集
你那網站可能是以前的了,你用過中搜的網站嗎?他們做出來的網站就有這個功能們可以從網路、google等很多網站上抓取新聞、博客,產品信息、供求信息等,我們公司就專門從事做這網站。我是技術。
㈤ 哪個文章採集軟體比較好
Evernote,Database,還有微軟的OneNote,都很好用的,網上也很容易就能搜到。Evernote需要聯網注冊才能用,Database破解版的很好使。
下面是有關幾款知識管理文章的文章。
通過上一篇《尋找最好的筆記軟體:海選篇》的綜合分析,作者發現有3種軟體具有較明顯的優勢,可謂「筆記軟體三強」。它們是:EverNote、Mybase 和 Surfulater。此三者相同之間差異較大,但都是各自風格門派的最強者。如何三選一,並不取決於它們誰「更強大」,而是取決於你是一個什麼樣的用戶,或你有什麼樣的需求。
EverNote
[圖片]
假如,你需要一個便利的地方來存放筆記,用不著太多組織功能和多餘功能,那麼,EverNote就是最適合你的。你可以這樣理解,EverNote就是無限長的一卷紙,上面記錄了你的所有筆記,其唯一的排列順序是依據時間。每條筆記甚至連標題都沒有——而在其他筆記軟體中這是無須考慮的原則。聽起來這很不方便,我怎麼能找到以前的筆記呢?作為一個優秀軟體,EverNote完美解決了你的擔心,你在使用時沒有任何不便,根本不會意識到這是個問題。
解決之道,也就是筆記定位/過濾的方法,共有2個:分類,實時搜索。分類功能如圖所示,可以手工,或按自動規則將筆記分類。
[圖片]
分類可以排成一個樹狀結構,但這與其他同類程序的樹狀結構也不相同。因為一條筆記可以分入多個分類。再一個筆記定位辦法是用實時搜索框。這一功能,在 EverNote中實現得如此完美,是我至今見過所有軟體中最好用的,並且速度飛快。隨著你鍵入每個字母,下面會動態顯示出所有符合的筆記。不僅如此,所有被匹配的單詞都高亮顯示。
[圖片]
如前文所述,所有筆記排成一列縱隊。如果要上下翻動,你可以點擊右側的滾動框,滾動速度取決於你點擊的位置。或者,你使用右邊的「時間條」功能。它相當於一個縱向排開的日歷,你只需點擊某個日期,就能顯示相關筆記。日期旁邊如果有√顯示,說明此日期中有筆記。我想,利用這一功能來做電子日記實在是方便。
Evernote還能方便地抓取任何內容,尤其重要的是,各種網頁內容。准確講,在三巨頭之中,它抓取網頁內容的能力最為強大。它不僅抓取范圍很准確,並且內容進入Evernote後,完全象一則筆記,而不是還象網頁:滑鼠變成小手,單擊會進入鏈接。在 EverNote中,如果你要訪問鏈接,需要雙擊才行。我從未對網頁點擊風格侵入軟體界面有過好感。還記得Windows為操作系統界面引入單擊模式嗎?用起來很不習慣,所以,我是每次必關。順便說一下,Mybase 和 Surfulater都是單擊模式。Mybase這樣做是因為它用了IE引擎來展示網頁;Surfulater這樣做是因為它的界面從頭到尾就是網頁風格。
編輯方面它還存在一些不足。要想對某條筆記真正做一些格工編排、文字組織,你需要進到全屏模式。這時,本條筆記單獨顯示在大窗口,並帶有rtf標準的工具欄,以便於編輯。而在常規窗口中,編輯按鈕幾乎沒有。你要麼進全屏模式,要麼右鍵菜單。再有,圖片縮放功能也比較怪。
[圖片]
總起來看,Evernote是那類「隨手而記,隨心而查」軟體中做得最好的。它最大的優點在於一流的實時搜索功能、強大的web內容抓取功能。其不足則是對筆記的組織、編輯功能較弱。
Mybase
[圖片]
如果一個用戶需要盡可能多的工具/功能來處理筆記,Mybase就是首選。在我看來,Mybase是進化為現代風格的 Keynote。它們兩者,無論在視覺還是感覺上都頗有類似。其界面精簡而高效,通過多tab、多面板有效擴展了其功能,具備處理筆記的多項工具。我用 Keynote 很長時間,再過渡到 Mybase 非常順利。(補充一下,KeyNote 在處理筆記方面也是功能極豐富的)。
Mybase組織筆記的形式也是最簡單的樹狀結構,這也是大多數同類軟體的標准思路。也就是說,在這方面,Mybase不求個性,而保持共性。到了最新的 v5版,Mybase增加了標簽功能——有點象Evernote的分類,或其他軟體的關鍵詞。它在分類樹基礎上,提供了額外一種組織維度。但其效果比起致力於此的工具(如Zoot、Evernote)尚有差距。當然了,最好的一點是,Mybase是能同時採取樹、標簽兩項功能的軟體之一(如果不是唯一的話)。這正是Mybase的風格和優勢:最多功能與選項,最大的可定製性。為了讓你對它的功能有最直觀了解,下圖展示了它各項菜單全部展開後的情形:
[圖片]
我們說過,Mybase用了很多面板,因此展示筆記信息的桌面空間就比較小。這與某些軟體形成了對比。如Surfulater,它採用超鏈接、網頁風格的功能來處理參考文獻、鏈接、附件等。而在Mybase中,用主界面下的單獨的子窗口/面板來分別展現這些元素:結構樹、筆記主體、搜索結果、附件列表、到其他筆記的鏈接。這種做法,讓有些人感到不適,但另一些用戶可能會很欣賞這種分離的做法——我就是其一。對一些通用性較高的面板,如附件、到其他筆記的鏈接,可以通過選項來設為自動顯示:如果筆記有附件或外向鏈接,則顯示;如果沒有,則隱藏這些面板。這時靈活應變的設置很實用,可以最大限度保留桌面空間。
[圖片]
Mybase對Firefox或IE也可以抓取網頁內容,但還達不到Evernote 或 Surfulater水平。首先,抓取內容並不象另兩款軟體那樣視為普通筆記。讓我解釋一下,對每條筆記,Mybase都有「文本筆記」和「網頁」兩個標簽。如果是抓取的網頁內容,Mybase自動切到網頁標簽。而對於其他類型的筆記,無論是粘貼進來還是手工輸入的,都是在「文本筆記」標簽下。
[圖片]
附:Mybase開發者補充: myBase 中所有內容均保存為節點的附件文件,所謂筆記 (note) 也是保存為一個附件文件,只是被命名為帶 .RTF 擴展名的特殊項,一般不會顯示出來,而且其他內容,如抓取的網頁,則直接保存為附件,在附件列表中可以看到網頁中的HTML/JS/樣式/圖片等元素。因此,輸入內容與抓取的網頁內容一般是分開顯示的;這樣設計給系統擴展帶來極大的便利性、靈活性與統一性。實際上,如果需要將 note 寫入網頁中,可以在網頁中按 F2 或選擇 Edit -> Toggle Edit Mode 菜單項,即可直接輸入或編輯網頁內容,這樣筆記就可以和抓取的網頁顯示在同一頁上了。
這樣處理的結果就是,你不能把筆記與網頁合在一起。基於此點,我認為Evernote和Surfulater的抓取功能更勝一籌。再有一點美中不足的是,Mybase採用IE而非內置的web引擎來展現抓取的網頁內容。因此,當你切換到網頁標簽時,程序會調用IE而有一個瞬間的停頓。當然,這一問題並不嚴重,只是不如另外的軟體那樣平滑集成。
附:Mybase開發者補充:目前絕大多數軟體都是嵌入IE來顯示網頁,所不同的是有些軟體一啟動就裝入了IE瀏覽器,而myBase只在需要瀏覽網頁時才調入IE,因此首次查看網頁時有一點停頓,此後就會非常平滑,這樣做的目的是為了盡量減少內存和系統資源佔用。
Mybase V5也開發了實時搜索功能。這是一項有價值的功能,用起來的效果也不錯。當然,它還比不上Evernote的水平,但至少是可用的。再強調一次,這正是 Mybase的比較優勢:雖不是每項功能都做到了所有軟體中這方面的最高水平,但至少讓用戶在一個軟體中,擁有了這么多功能。
[圖片]
附:Mybase開發者補充:在最新的myBase v5.3中專門重寫了索引模塊及搜索技術,加入了可調大小的高速緩存技術,提供了相當高的索引性能,同時支持增量索引、大數據量索引、即時搜索及布爾條件 (AND/OR/NOT),對常見的WORD/EXCEL/HTML/PPT/EMAI/TEXT/RTF等多種文檔都提供了預置的索引與搜索支持,還可以通過安裝第三方過濾器實現更多的文檔格式的識別,比如 PDF 文檔,此外,myBase還特別地提供了一定的中文搜索支持(但還不完善),總的來說我們當前開發的索引技術已經遠遠超過其他幾家,可以用稍大一些的數據作一些測試,比如100MB以上的可索引數據,就可以看出我們付出了相對多的努力來改進這項技術,當然也還需要進一步改進。
Mybase還提供了一些擴展的組織功能。它可以條目鏈接,從而讓多個筆記之間互為參考。也可以符號鏈接,從而讓用戶在結構樹上點擊筆記A時,直接進入它鏈接到的筆記B,就象一個快捷方式一樣。我還不能充分理解這一功能的作用,但還是那句話,有比無好。(譯者註:應該是用於一條筆記進入多個樹狀分支吧,等同於Evernote的一條筆記進入多個分類)然後,它還能自定義標簽(label),就象筆記的關鍵詞一樣(譯者註:更准確講,是tag),當你點擊關鍵詞時,Mybase會列出歸入此關鍵詞的所有筆記。就象我所說的,它為組織筆記提供了一個新維度。
正如你所見的,Mybase是此類軟體中最靈活、功能最豐富的一個。其他軟體與Mybase相比,或許更具有創新性,或許在某些方面更強大,但沒有一個能同時擁有Mybase這樣多的筆記處理功能。再次重申一下,以前用KeyNote的用戶,可以平滑過渡到Mybase。正因如此,我現在已經開始用 Mybase來作為當前處理筆記的工具。然後,根據情況最終決定用哪款軟體。
Surfulater
[圖片]
Surfulater的初衷是作為網頁抓取和文獻管理工具,然後——也是順理成章地——進入了筆記軟體行列。由於這一歷史原因,它在界面上與其他筆記軟體有很大差異。也就是說,本專題涉及的其他軟體從開始就是以筆記為核心功能進行開發,而筆記只是Surfulater功能之一,並且不是最初的主導功能。
Surfulater作為一種內容抓取(網頁抓取只是其中一方面)和文獻管理工具,在這方面做得比誰都好。如果要便捷強大的鏈接、文獻管理,並收錄資料,則最適合選擇Surfulater。下面這個場景可作為對Surfulater的最佳描述:你就某一專題在互聯網上搜資料,然後找到一個網頁,正是你所需要的資料,並且有很多到相關站點的鏈接。這就是Surfulater軟體要做的,並且非常輕松。你可以把各種信息全部收進來,拖拖拽拽,把資料、鏈接、附件放在一起,不一會兒,你就可以得到一個完整的信息系統,並且具有格式優良的web展示頁面、鏈接,凡你所需,皆在此中。
Surfulater的最大強項在於重復性工作的自動完成。在抓取一個網頁後,Surfulater會自動填入標題、描述、到原出處的鏈接、抓取日期。它甚至會為原始網頁創建一個縮略圖。用戶可以把其他筆記拖到當前筆記上,建立快速參考。這一操作同樣適用於附件。如同 Evernote一樣,全部筆記也是前前後後,排成一長列。但是,它的隊列線索不象Evernote一樣,僅局限於時間,所以要靈活得多。
最讓我感興趣的,是Surfulater的結構樹。初看起來,它中規中矩,並無突出之處。但實際上,它擁有目前全部軟體中最好的後台引擎。它實際上是一種虛擬的樹狀結構,可以按不同選項進行配置。筆記可以按用戶需求按樹狀展示,但是也可以象Evernote一樣按時間順序排列。你還可以讓結構樹不展開末級分支,這樣,結構樹只展示目錄,而不展示筆記條目。重要的一條消息是,開發者提過,在新版本中會允許用戶自定義樹結構,這意味著一條筆記有可能進入多個分類。
[圖片]
還有一個突出的功能是,Surfulater可以克隆筆記項目。初看起來,它的效果與復制相同。但實際上,它們差別很大。克隆後的副本實際是一種鏡像:不重復佔用存儲空間,但可以邏輯上放在另外一個類別中,並且相互之間實時一致。比如,修改其中的任一個,其他克隆副本會同時更新。最後,一個出色功能是把搜索結果作為一個虛擬的結構樹分支,列在樹結構的最後面。用戶可以在搜索結果中進行瀏覽、滾動,和正常的樹、筆記完全一樣。當然,命中的關鍵詞也象 Evernote一樣高亮顯示。對於搜索結果,Evernote也匯集在一起縱向排列,但我認為建立一個列表,可以更方便用戶查閱。
[圖片]
接下來是一個小功能,即設定筆記或分支節點的圖標,Surfulater在這方面做得非常棒,其他軟體與之相比,無不相形見絀。用戶只須右鍵點擊圖標,然後就會彈出一個小窗口,展示出所有可用的圖標,想選哪個,點擊即可。(注1)
[圖片]
接下來,我們說一下Surfulater作為一個筆記軟體的不足之處,這些不足的最主要原因就是因為Surfulater的初衷並不是用來做筆記。如果你要編輯筆記,在絕大多數的筆記軟體中,只要點擊這一筆記,開始輸入文字即可。但是到了Surfulater這里,此路不通。你必須要在編輯模式與常規模式間手工切換——這經常令新手無所適從。進入編輯模式的一個辦法是,滑鼠點住某個輸入框持續幾秒鍾,也就是說,不象一般軟體那樣點擊,而是長按。還有一種進入編輯模式的辦法,就是點擊每一內容旁邊的鉛筆圖標。值得慶幸的是,作者意識到了這一問題,已經做了改進,並承諾在將來做出進一步的提高。但是,我仍然堅持這樣一個原則:筆記軟體應當默認處於可編輯狀態,只要用戶想做編輯,就能馬上進行,不能有任何形式和原因的延緩。
再一個不足之處是,Surfulater中找不到一個空白的地方直接做筆記。Surfulater中任何文章(也就是筆記)都基於事先定義好的模板。這些模板有頭信息,用於保存標題、注釋、評級、參照……。這些功能對於學術研究而言,非常有利於管理和組織;而對於普通用戶,尤其是只想隨手記點東西時,則是一個極不方便的限制。現在能做的是,選一個「筆記模板」,它只有一個頭信息,就是「筆記」,主體部分就是完全空白,用戶就在這里做筆記。如下圖:
[圖片]
Surfulater要成為一個真正的筆記工具,其底線就是在上述兩方面做出改進:提供一個編輯模式默認開或關的選項,提供一個完全空白的筆記區域。准確地講,在這些方面,Surfulater必須向標準的——也是實踐證明最有效的——筆記軟體風格靠攏。
總起來看,Surfulater功能豐富而風格獨特,最適於大量筆記的引用、導航與抓取。從我的了解和判斷來看,律師、學者可能會非常欣賞它。原因嘛,想想它與眾不同的功能就會明白。如下的場景也可說明哪些人最適合它:如果你現在正使用Evernote,卻發現它在組織管理方面還不夠強,那你轉向 Surfulater就是明智的選擇。或者你正在使用任何其他基於最基本的樹狀結構的筆記軟體,而感到處理鏈接、引用方面力不所心,那也可以轉向 Surfulater。
三強功能對比表
上面逐一論述了三強筆記軟體的優劣,相信各位讀者已經有所認識。如果還嫌不清晰,請看下錶。俗話說,不怕不識貨,就怕貨比貨。這一表格並沒有涵蓋所有功能,但還是能提供不少幫助的。
筆記三強功能對比表
EverNote Mybase Surfulater
同時打開多個資料庫 √ √
實時搜索(輸入的同時即開始搜索) √ √
基本樹結構 √ √
標簽/分類 √ √
滾動展示 √ √
加密 √ √
鏈接到其他筆記 √ √
按時間順序展示 √ 注2 √
超強的導入/導出功能 √
收藏夾 √
筆記克隆 注3 √
web界面導航(單擊式) √
筆記編輯
標準的RTF功能 √ √ √
超鏈接方式展現附件、鏈接 √ √
單獨面板方式展現附件、鏈接 √
自定義的文本模板 √
自定義的 xml 模板 √
表格 注4
鎖定筆記防修改 √ 注5
筆記標題 √ √
頁面抓取
可抓取更多內容(圖片、文本) √ √ √
抓取內容可編輯 √ √ √
筆記與抓取內容可同時顯示 √ 注6 √
用內置引擎展現抓取內容 √ 注7 √
用已安裝的瀏覽器(IE)展現抓取內容 √
至此,三強篇正文部分結束,下面的附註是xbeta徵求Mybase開發者時,所得到的補充。
注 1:Mybase開發者補充:原作者好象沒有注意到 myBase 中的強大圖標功能,與其他幾個程序不同, myBase的圖標是開放式的,而且是 per database 的實現,也就是說每個DB都可以由用戶自行添加任何多的用戶自己喜愛的圖標,myBase 本身預定義有一套預設的圖標,同時隨安裝包還提供了一組網上採集的圖標,可以方便的引入到任何.nyf庫中,並提供了成批為樹節點指定/替換圖標的工具。不過,需要注意的是,新建的空白.nyf庫不會自動引入任何圖標,所以初次打開圖標框是空的,這時用戶可以根據需要引入自己喜愛的圖標進入,稍後即可方便指定圖標了。
注2:Mybase開發者補充:myBase 有一個 seekbytime 插件,可以按修改時間列出項目,同時內置的高級搜索也提供了按時間段搜索,間接實現了按時序展示,而且可以方便的逆排序。
注3:Mybase開發者補充:在 myBase 復雜筆記,即使復雜分枝中所有筆記也都很簡單,Ctrl+拖放,或者 Copy/Paste,而且分枝可以在不同的庫之間復制。
注4:Mybase開發者補充:myBase 5.x 目前只實現了簡單的RTF表格,僅僅好於沒有。
注5:Mybase開發者補充:myBase 有隻讀打開模式,按只讀方式打開後,只能查看,不可編輯。按住 Ctrl 選擇 Reopen 項即可切換打開模式。
注6:Mybase開發者補充:是否同時顯示,取決於是否將筆記寫入網頁中,在網頁中按F2即可進入編輯狀態,在網頁中添加自己的注釋內容。
注7:Mybase開發者補充:基本都是調用IE展取網頁內容,與其他幾家不同的是, myBase 只在需要展顯網頁時才調入IE,這樣確保不浪費太多系統資源。
㈥ 自動採集,上傳文章,瞬間建站怎麼搞用什麼軟體
這樣建站系統非常多,基本都有自帶的採集功能。但附帶的採集功能難免有局限性。你可以使用第三方的採集軟體實現採集。如果是新手,可以使用熊貓採集軟體,不需要技術就可操作。且功能全面。自動採集、自動發布。
㈦ 求一個採集文章直接生成整站的軟體。
採集和生成兩回事,採集方面,可以考慮熊貓採集軟體,免費,上手快。值得考慮。
㈧ 能自動採集偽原創文章並且自動上傳到自己網站的軟體!
有的,市面上有很多的自動採集偽原創的軟體但是都是需要編寫規則的,要有一定的代碼基礎,一米智能文章採集系統去掉了傳統瑣碎的功能,即使是新手也是應用自如。
㈨ 求一款可以批量採集並以文本格式保存的文章採集軟體!!
Evernote,Knowlesys,還有微軟的OneNote,都很好用的,網上也很容易就能搜到。Evernote需要聯網注冊才能用,Knowlesys的很好使,不過不知道有破解版沒有。 三者相同之間差異較大,但都是各自風格門派的最強者。如何三選一,並不取決於它們誰「更強大」,而是取決於你是一個什麼樣的用戶,或你有什麼樣的需求。 Knowlesys(樂思)能方便地抓取任何內容,尤其重要的是,各種網頁內容。准確講,它抓取網頁內容的能力最為強大。它不僅抓取范圍很准確,
㈩ 有沒有好的免費的文章採集工具,我不需要發布,我是採集文章然後修改自己發布的。
有的 ,採集後不發布,保存到本地,題主可以根據自己的要求來自己修改,量少的話可以手工搞的,多的話建議用工具批量做,可以提高你的工作效率。簡單的分析一下你提到工具:
1、熊貓文章採集器:一般用於小說的採集,適合老手
2、一米智能文章採集系統:可用於站內的所有文字信息,適合新手和老手
3、火車頭採集軟體:規則編寫麻煩,適合老手