<p id="hcdus"><li id="hcdus"><pre id="hcdus"></pre></li></p>

        亚洲成人在线网址,日韩性色,久久草网站,超碰911,亚太无码,五十路熟妇,青青草99,国产玖玖
        首頁
        您好,歡迎來到乙方寶標訊
        乙方寶,全國招投標政府采購信息平臺
        招標信息
        中標信息
        采購意向
        擬在建
        直采信息

        科技文獻語料數據處理系統輔助研發與技術服務(ZJLAB-FS-BX20260026)采購公告

        浙江杭州 全部類型 2026年03月27日
        下文中“***”為隱藏內容,僅對乙方寶會員用戶開放,會員后可查看內容詳情
        項目名稱 科技文獻語料數據處理系統輔助研發與技術服務 項目編號 ****
        公告開始日期 **** 10:25:55 公告截止日期 **** 11:00:00
        采購單位 點擊登錄查看 付款方式 合同簽訂后7個工作日內向乙方支付50%;項目驗收后7個工作日內向乙方支付剩余50%。
        聯系人 聯系電話
        簽約時間要求 到貨時間要求
        預算總價 ¥280000.00
        發票要求
        含稅要求
        送貨要求
        安裝要求
        收貨地址
        供應商資質要求

        符合《政府采購法》第二十二條規定的供應商基本條件

        公告說明

        采購清單1
        采購商品 采購數量 計量單位 所屬分類
        科技文獻語料數據處理系統輔助研發與技術服務 1 基礎軟件開發服務
        品牌
        型號
        預算單價 ¥ 280000.00
        技術參數及配置要求 服務履行時間:駐場及售后服務不少于4個月,確保團隊有足夠時間與甲方深入溝通與協作,保障項目的高效推進與按時交付。 內容如下: 1. 文獻語料接入與分布式解析流水線建設 ● 面向多個大規模科技文獻類數據集,開展統一的文檔接入與預處理工作: ○ 完成千萬級PDF文檔的提取、校驗與結構化整理; ○ 構建高質量元數據體系,實現同等規模的元數據規范化入庫; ○ 保障元數據字段完備率不低于98%,有效可解析文檔率不低于95%; ● 構建基于Ray的K8s任務模式: ○ 支持單批次處理能力達數十萬頁級別的并行解析任務; ○ 具備斷點續跑、失敗重試與日志回寫; ○ 任務從提交到調度啟動的端到端時延不超過30秒; ● 形成一套標準化、可復用的數據接入工具鏈與操作流程,支持未來新增數據源的快速接入與自動化處理,降低運維成本,提升平臺擴展能力。 2. 文獻解析生產與速度優化 ● 承擔平臺日常文獻語料處理任務; ● 對OCR進行工程優化及顯卡適配: ○ GPU資源調度與批處理策略 ○ 模型加載與推理流程優化 ○ OCR在不同顯卡上,打包部署適配及性能測試 關鍵運行指標: ● 單節點解析效率 ≥ 3000頁/小時 ● GPU平均利用率 ≥ 70% ● 批量任務連續穩定運行 ≥ 72小時 3. 文獻解析工具迭代開發 ● 圍繞海納平臺文獻解析應用需求,對在線OCR服務進行功能迭代與模型升級,提升對復雜版式與大規模文獻的解析能力。 ● 完成OCR服務的月度迭代發布機制建設,支持表格內容多格式復制、輸入頁碼快速跳轉以及解析過程可視化展示,實現對識別結果的實時預覽與進度反饋;開展模型版本升級與優化,建立Bad Case/Good Case提交流程,不斷提升對跨頁表格、混排圖文及復雜版式的識別效果。 ● 完善批量解析任務能力,支持大批量文獻文件的統一上傳與處理,實現解析任務的集中管理與狀態提示;構建分級解析服務體系,滿足千量級、萬量級及十萬量級以上數據規模的穩定處理需求,為上層業務提供可靠的結構化解析服務。 以上建設內容包括但不限于上述需求,并根據平臺實際應用場景持續完善相關功能與性能。 4. 文獻語料生產流水線數據源算子擴展 ● 結合Ray分布式解析任務,對Data-Juicer處理流程進行工程化適配與功能補齊,保障文獻語料在Kubernetes環境下的穩定運行。 ● 完成常用處理算子的對接與調試,支持在任務運行時進行算子加載與參數配置,解決依賴沖突與版本兼容問題,使算子執行成功率不低于98%;圍繞OCR與PDF解析場景,完成關鍵算子的封裝與流水線集成,滿足千萬級文獻處理需求。 ● 提供相關代碼、配置與部署說明,保障在Kubernetes環境下穩定運行不少于48小時。 5.驗收標準 ●完成多個大規模科技文獻類數據集的文獻語料接入與整理,實現千萬級文檔的規范化處理與入庫,形成同等規模的結構化元數據,保障元數據字段完備率不低于98%,有效可解析文檔率不低于95%,并提供標準化、可復用的數據接入工具鏈與操作流程。 ●完成文獻解析流水線的工程優化及顯卡適配測試,實現單節點解析吞吐量不低于3000頁/小時,GPU平均利用率不低于70%,能夠連續穩定運行不少于72小時。 ● 完成在線OCR服務的迭代升級,支持跨頁表格識別與合并、表格內圖像還原及復雜版式解析,具備多格式導出、批量解析與任務管理能力,滿足千量級至十萬量級文獻的穩定結構化解析需求。 ●完成基于Data-Juicer的文獻處理適配,實現關鍵算子的對接與參數配置,在Kubernetes環境下穩定運行不少于48小時,并滿足千萬級文獻處理的實際需要。 ●提供與本項目相關的工程代碼、Dockerfile鏡像構建文件、部署腳本及技術文檔,滿足項目組后續運維、復用與二次開發需要,驗收需在****前完成
        參考鏈接
        售后服務 乙方負責向甲方提供技術售后服務2個月,自甲方簽收產品之日起;發生質量問題,乙方要在24小時內響應,必要時72小時內到用戶現場排除故障,售后服務地點由甲方確定。;

        附件下載:點擊登錄查看網上比選綜合打分采購文件202602.docx
        關注乙方寶服務號,實時查看招標信息>>
        模擬toast