作者:京東物流 葉方偉
EXCEL導(dǎo)入—設(shè)計(jì)與思考
一、案例信息與設(shè)計(jì)
1.1、案例需求與背景
B2BTC同城二期有一個(gè)Excel導(dǎo)入的功能,單次數(shù)據(jù)量小于一千,使用頻次不高。但涉及到多個(gè)字段組成唯一約束,即每條數(shù)據(jù)操作時(shí)要根據(jù)唯一性組合字段來(lái)操作,要確保數(shù)據(jù)表中的數(shù)據(jù)不違反唯一性。
每條數(shù)據(jù)涉及到多次查詢其他業(yè)務(wù)RPC來(lái)校驗(yàn)、補(bǔ)充信息的訴求,即使有緩存,但也可能涉及到緩存不命中問(wèn)題,即單條數(shù)據(jù)的校驗(yàn)和導(dǎo)入的時(shí)效性保障不了。
1.2、整體解決方案
以下四個(gè)方案為開(kāi)發(fā)過(guò)程中依次思考的四個(gè)方案,沒(méi)有絕對(duì)利弊。
1.2.1、初始構(gòu)思開(kāi)發(fā)方案(同步導(dǎo)入)
首先想到的方案為常用的同步導(dǎo)入,即在一臺(tái)容器的一個(gè)線程中完成Excel中數(shù)據(jù)的解析、校驗(yàn)、導(dǎo)入、發(fā)送通知消息三部分流程。
問(wèn)題:
1.當(dāng)數(shù)據(jù)量過(guò)大時(shí),在單臺(tái)服務(wù)器上操作時(shí)對(duì)服務(wù)器造成比較大的內(nèi)存壓力。
2.流程比較長(zhǎng),每條數(shù)據(jù)涉及多次RPC查詢,總體時(shí)間很長(zhǎng)。接口TP99會(huì)比較高 + 用戶體驗(yàn)很差。
優(yōu)點(diǎn):
1.可以讓前端同步獲取導(dǎo)入結(jié)果。
1.2.2、方案二(改進(jìn)版)
由于方案一時(shí)效不可控制,在參考了另外一個(gè)Excel導(dǎo)入場(chǎng)景后設(shè)計(jì)了以下方案:
基于原有的方案,該方案使用了線程池來(lái)校驗(yàn)數(shù)據(jù)并通過(guò)MQ來(lái)異步地處理每條數(shù)據(jù),這樣基于原有的方案有一定的效率提升。
但由于當(dāng)時(shí)思考不充分,開(kāi)發(fā)完成之后發(fā)現(xiàn)和實(shí)際場(chǎng)景不適配,并可能有TP99超時(shí)風(fēng)險(xiǎn),只作為記錄。
問(wèn)題:
1.業(yè)務(wù)可以結(jié)束完全的異步,所有的導(dǎo)入結(jié)果都通過(guò)。
優(yōu)點(diǎn):
1.可以讓前端同步獲取校驗(yàn)結(jié)果。
2.線程池和異步處理一定程度上提升了數(shù)據(jù)處理效率。
適用場(chǎng)景:
本方案適用于前端需要同步獲取導(dǎo)入的結(jié)果,后端不涉及唯一性校驗(yàn)(有單號(hào)等唯一主鍵信息)的場(chǎng)景,可以校驗(yàn)數(shù)據(jù)之后進(jìn)行批量插入(不用MQ來(lái)發(fā)消息異步處理數(shù)據(jù))。
方案本身沒(méi)有什么問(wèn)題,問(wèn)題在于方案和引用場(chǎng)景不是最佳適配:本次導(dǎo)入不要求前端能即時(shí)獲取到導(dǎo)入的結(jié)果,因此無(wú)需在這里同步獲取到結(jié)果之后再異步處理數(shù)據(jù),可以將 excel解析 + 數(shù)據(jù)校驗(yàn) + 處理消息統(tǒng)一均異步處理。
1.2.3、方案三(最終版)
由于業(yè)務(wù)方?jīng)]有同步獲取導(dǎo)入結(jié)果或者校驗(yàn)結(jié)果的任何訴求,因此這里將 excel解析 + 數(shù)據(jù)校驗(yàn) + 處理消息統(tǒng)一均異步處理(JMQ發(fā)消息給消費(fèi)者來(lái)處理這些流程),只對(duì)必要的參數(shù)進(jìn)行校驗(yàn)。
對(duì)于數(shù)據(jù)處理,將Excel數(shù)據(jù)拆分為每條的粒度,用 線程池來(lái)進(jìn)行 數(shù)據(jù)校驗(yàn)并處理,最終由主線程統(tǒng)計(jì)結(jié)果。
此外,在進(jìn)行數(shù)據(jù) 查詢唯一性數(shù)據(jù) + 操作數(shù)據(jù)(增加刪除修改) 的最小并發(fā)影響粒度加上Redis鎖來(lái)保障數(shù)據(jù)表的唯一性不會(huì)被破壞。
問(wèn)題:
1.所有的 excel解析 + 數(shù)據(jù)校驗(yàn) + 處理消息 均在一臺(tái)服務(wù)器上執(zhí)行,對(duì)服務(wù)器的壓力會(huì)比較大。
優(yōu)點(diǎn):
1.用線程池處理消息,大大縮短了消息處理的時(shí)間,減少了單個(gè)服務(wù)器壓力。
2.有兜底策略,可確保數(shù)據(jù)不丟失,導(dǎo)入流程可以正常且按時(shí)結(jié)束,不會(huì)無(wú)上限等待。
3.除必要校驗(yàn)的所有流程均異步處理,接口的TP99可靠且較快。
適用場(chǎng)景:
1.對(duì)數(shù)據(jù)完整性要求比較的業(yè)務(wù)。
2.數(shù)據(jù)量不會(huì)太大的業(yè)務(wù)。(避免對(duì)單個(gè)容器造成較大壓力)
1.2.4、方案四(理想版)
對(duì)于方案三,將所有的數(shù)據(jù)校驗(yàn) + 處理的流程都給一臺(tái)服務(wù)器執(zhí)行,造成單臺(tái)服務(wù)器壓力比較大,且并發(fā)度不夠高,總體流程時(shí)效性可能得不到保障。因此設(shè)想了一個(gè)較為理想的方案四場(chǎng)景,適用于數(shù)據(jù)量大、對(duì)數(shù)據(jù)可靠性要求不高、時(shí)效性要求高的場(chǎng)景。
相比方案三,方案四減少了對(duì)應(yīng)的對(duì)賬、兜底機(jī)制,整體的流程還是異步進(jìn)行。相比于線程池,用 JMQ 發(fā)送消息給 數(shù)據(jù)校驗(yàn)并處理的consumer來(lái)處理消息并記錄結(jié)果到Redis來(lái)跟蹤導(dǎo)入進(jìn)度。此外,在進(jìn)行數(shù)據(jù) 查詢唯一性數(shù)據(jù) + 操作數(shù)據(jù)(增加刪除修改)+ 更新Redis中最終結(jié)果 的最小并發(fā)影響粒度加上Redis鎖來(lái)保障數(shù)據(jù)表的唯一性不會(huì)被破壞。
問(wèn)題:
1.沒(méi)有兜底策略,數(shù)據(jù)校驗(yàn)處理的流程中可能出現(xiàn)有一條消息阻塞丟失意外結(jié)束,導(dǎo)致最終沒(méi)有線程統(tǒng)計(jì)結(jié)果并發(fā)送咚咚消息。
優(yōu)點(diǎn):
1.除必要校驗(yàn)的所有流程均異步處理,接口的TP99可靠且較快。
2.利用拆分導(dǎo)入數(shù)據(jù) + 多個(gè)Consumer處理消息,大大縮短了消息處理的時(shí)間。
3.拆分?jǐn)?shù)據(jù)為消息異步處理,用了JMQ的重試機(jī)制來(lái)提升了數(shù)據(jù)處理的可靠性。
適用場(chǎng)景:
1.本方案適用于前端無(wú)需同步獲取導(dǎo)入的結(jié)果,后端可以完全異步處理數(shù)據(jù)的場(chǎng)景。
2.對(duì)數(shù)據(jù)可靠性要求不是極高的業(yè)務(wù),可接受小概率容錯(cuò)。
3.對(duì)導(dǎo)入結(jié)果失效有一定訴求的業(yè)務(wù)。
4.數(shù)據(jù)量比較大或操作比較頻繁的業(yè)務(wù)。
二、持續(xù)思考
2.1 中間件的合理使用
合理利用JMQ來(lái)解耦、拆分業(yè)務(wù)邏輯可以減少單臺(tái)服務(wù)器實(shí)例內(nèi)存或CPU的壓力、提高數(shù)據(jù)處理并發(fā)量,同時(shí)可以利用MQ的重試機(jī)制來(lái)盡可能保障對(duì)應(yīng)業(yè)務(wù)的可用性。
同時(shí),異步處理可能存在結(jié)果丟失的情況,在數(shù)據(jù)可靠性要求不高的場(chǎng)景可以合理舍棄這種小概率場(chǎng)景發(fā)生的問(wèn)題(因?yàn)橛兄卦囘€一直失敗)。但在數(shù)據(jù)可靠性要求比較高的場(chǎng)景,需要有對(duì)應(yīng)的對(duì)賬機(jī)制 + 兜底機(jī)制來(lái)統(tǒng)計(jì)數(shù)據(jù)的處理情況。(如Excel導(dǎo)入,可以將解析完成的數(shù)據(jù) 和 最終導(dǎo)入的數(shù)據(jù)進(jìn)行一個(gè)數(shù)據(jù)對(duì)賬,如果有數(shù)據(jù)丟失或者無(wú)響應(yīng),發(fā)出告警,讓定時(shí)任務(wù) 或 人工進(jìn)行二次核驗(yàn)來(lái)確保數(shù)據(jù)可靠不丟失)
但中間件的過(guò)度使用使得服務(wù)過(guò)度依賴中間件的可靠性,問(wèn)題追蹤定位難度會(huì)進(jìn)一步加大,需要結(jié)合實(shí)際業(yè)務(wù)場(chǎng)景綜合權(quán)衡。
2.2 業(yè)務(wù)充分適配場(chǎng)景
在進(jìn)行方案的技術(shù)設(shè)計(jì)時(shí),不要只是照葫蘆畫(huà)瓢,要結(jié)合自己的業(yè)務(wù)場(chǎng)景、業(yè)務(wù)數(shù)據(jù)量、可靠性要求等場(chǎng)景充分考慮,借鑒其他方案的可用之處。
如本文檔中方案二借鑒了之前的方案設(shè)計(jì),但沒(méi)有考慮自己的業(yè)務(wù)場(chǎng)景是不是與其適配,沒(méi)有充分適配自己的實(shí)際業(yè)務(wù),還可能引入新的問(wèn)題。
沒(méi)有最好的技術(shù)方案,只有適配于當(dāng)前業(yè)務(wù)場(chǎng)景的最佳方案。
審核編輯 黃宇
-
內(nèi)存
+關(guān)注
關(guān)注
8文章
3125瀏覽量
75274 -
Excel
+關(guān)注
關(guān)注
4文章
227瀏覽量
56656
發(fā)布評(píng)論請(qǐng)先 登錄
在LabVIEW中導(dǎo)入導(dǎo)出Excel文件程序設(shè)計(jì)
如何向LABVIEW導(dǎo)入MATLAB生成的EXCEL數(shù)據(jù)?
哪位師傅有EXCEL導(dǎo)入labview表格的程序
將EXCEL導(dǎo)入后,表格能改動(dòng)怎么做?
labview關(guān)于怎么將excel表格數(shù)據(jù)導(dǎo)入的問(wèn)題
用excel模板做報(bào)表導(dǎo)入數(shù)組時(shí)出現(xiàn)這個(gè)問(wèn)題怎么解決?謝謝
【Excel教程】EXCEL表格讀取與寫(xiě)入教程分享
Excel的文件導(dǎo)入Labview。
數(shù)據(jù)怎么導(dǎo)入excel表?
C#如何實(shí)現(xiàn)Excel表格導(dǎo)入數(shù)據(jù)庫(kù)
CAD免費(fèi)教程:如何將Excel數(shù)據(jù)快速導(dǎo)入CAD圖紙

Excel的操作使用教程免費(fèi)下載

評(píng)論