資料介紹
程序開發(fā)背景
本程序來源于我們項目組最近正在開發(fā)的一個開源項目網(wǎng)頁分塊工具。其目的是作為一個底層的信息抽取模塊,為后期分析提供盡可能詳盡的分塊線索,包括盡可能完整的HTML源代碼和網(wǎng)頁元素的位置、顏色、字體、背景色等信息。程序還要具有較好的適應(yīng)性,能夠支持多種網(wǎng)頁,而事實上很多網(wǎng)頁都是不標(biāo)準(zhǔn)的。從通用性考慮,程序應(yīng)該能夠支持多種應(yīng)用,而不僅限于網(wǎng)頁分塊。
預(yù)期目標(biāo)分析
程序應(yīng)達到以下幾點設(shè)計要求:
能夠指定要處理的網(wǎng)頁的URL能夠為HTML源代碼添加附件信息,如元素位置對于 Javascript等動態(tài)腳本具有良好的解析能力。通過命令行調(diào)用,提供良好的通用性通過 socket套接字返回HTML源代碼。支持延時讀取,保證抓取的成功率支持超時退出,保證程序不會因為加載不成功而卡死。

- FreeRTOS內(nèi)核實現(xiàn)與應(yīng)用開發(fā)實戰(zhàn)指南 289次下載
- 借助局部實體特征的事件觸發(fā)詞抽取方法 2次下載
- 微內(nèi)核與宏內(nèi)核的比較與分析 11次下載
- 如何使用Linux內(nèi)核實現(xiàn)USB驅(qū)動程序框架 20次下載
- FreeRTOS 內(nèi)核實現(xiàn)與應(yīng)用開發(fā)實戰(zhàn)指南PDF電子書免費下載 1.9k次下載
- 使用51單片機內(nèi)核實現(xiàn)CRC16校驗的程序免費下載
- 節(jié)點屬性的海量Web信息抽取方法 0次下載
- 基于XML特征的網(wǎng)頁文本抽取方法 0次下載
- 基于WebHarvest的健康領(lǐng)域Web信息抽取方法 0次下載
- 嵌入式內(nèi)核實踐 0次下載
- 英特爾最小型內(nèi)核實現(xiàn)邊緣智能 0次下載
- 基于XML的WEB信息抽取模型設(shè)計
- Windows下網(wǎng)頁信息實時監(jiān)聽程序的設(shè)計與實現(xiàn)
- 基于重復(fù)模式的自動Web信息抽取
- 基于子樹廣度的Web信息抽取
- 開發(fā)第1個LVGL程序與實現(xiàn)按鍵操作 4.6k次閱讀
- 瀏覽器網(wǎng)頁與T5L迪文屏串口深度擴展(Node-RED技術(shù)) 1.9k次閱讀
- 什么是網(wǎng)頁應(yīng)用程序測試? 1.5k次閱讀
- Instruct-UIE:信息抽取統(tǒng)一大模型 2.6k次閱讀
- 基于統(tǒng)一語義匹配的通用信息抽取框架USM 1.9k次閱讀
- 使用動態(tài)輸出打印內(nèi)核的DEBUG信息 1.4k次閱讀
- 如何統(tǒng)一各種信息抽取任務(wù)的輸入和輸出 2k次閱讀
- Linux內(nèi)核中Netfilter的設(shè)計與實現(xiàn) 2.7k次閱讀
- 基于單片機和μC/0S-II內(nèi)核實現(xiàn)串口通信模塊的設(shè)計 2.3k次閱讀
- 利用Python實現(xiàn)網(wǎng)頁應(yīng)用程序,可圖片識別狗的類型(附源碼) 3.4k次閱讀
- 嵌入式Linux內(nèi)核的驅(qū)動程序開發(fā)是怎樣的 1.9k次閱讀
- 基于嵌入式Linux內(nèi)核的系統(tǒng)設(shè)備驅(qū)動程序開發(fā)設(shè)計 1.5k次閱讀
- FPGA的FIR抽取濾波器設(shè)計詳細教程 2.8k次閱讀
- USB固件程序開發(fā)的實現(xiàn) 9.4k次閱讀
- 數(shù)字下變頻中抽取濾波器的設(shè)計及FPGA實現(xiàn) 6.5k次閱讀
下載排行
本周
- 1冷柜-電氣控制系統(tǒng)講解
- 13.68 MB | 4次下載 | 10 積分
- 2安川A1000變頻器中文版說明書
- 20.16 MB | 3次下載 | 3 積分
- 3直流電路的組成和基本定律
- 1.67 MB | 2次下載 | 免費
- 4丹佛斯2800系列變頻器說明書
- 8.00 MB | 1次下載 | 5 積分
- 5PC8011同步開關(guān)型降壓3.5A單節(jié)鋰電池充電管理電路技術(shù)手冊
- 0.74 MB | 1次下載 | 免費
- 6ES7243E+ES8311音頻錄制與播放電路資料
- 0.06 MB | 1次下載 | 5 積分
- 7SDM02 激光測距模塊產(chǎn)品手冊
- 0.43 MB | 1次下載 | 免費
- 8SDFM 激光測距模塊模組手冊
- 0.54 MB | 1次下載 | 免費
本月
- 1CH341編程器軟件NeoProgrammer_2.2.0.10
- 20.47 MB | 170次下載 | 1 積分
- 22025智能家居傳感器市場分析及創(chuàng)新應(yīng)用
- 3.11 MB | 43次下載 | 免費
- 3RV1126B系列開發(fā)板產(chǎn)品資料
- 4.19 MB | 18次下載 | 免費
- 4CH341編程軟件下載
- 2.50 MB | 16次下載 | 5 積分
- 5全志系列-米爾基于T153核心板開發(fā)板 四核異構(gòu)、3路千兆網(wǎng),賦能多元化工業(yè)場景
- 3.05 MB | 12次下載 | 免費
- 6【開源】60余套STM32單片機、嵌入式Linux、物聯(lián)網(wǎng)、人工智能項目案例及入門學(xué)習(xí)資源包
- 10.55 MB | 8次下載 | 免費
- 7冷柜-電氣控制系統(tǒng)講解
- 13.68 MB | 4次下載 | 10 積分
- 8特斯拉MODEL S車載充電機主電路回路原理圖
- 0.81 MB | 4次下載 | 3 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233094次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191448次下載 | 10 積分
- 5十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183356次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81604次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73824次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論