秋霞步兵区国产精品,国产精品视频二区第二页,亚洲aⅴ欧美综合一区二区三区,亚洲日韩欧美一区二区不卡

      1. <small id="x8tpb"></small>
        <address id="x8tpb"></address>

        新疆信息港歡迎您!

        新疆信息港
        新疆信息港 > 財(cái)經(jīng) >幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑!

        幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑!

        2020-11-19 05:43:27
        來源:互聯(lián)網(wǎng)
        閱讀:-

        也一定要主要主要表的字段類型,不要望文生義,id不一定是數(shù)字。第五步一定要多花點(diǎn)時(shí)間反復(fù)校驗(yàn),不要因?yàn)樾〖?xì)節(jié)而花大時(shí)間回溯數(shù)據(jù)。...

        深深的感受到“細(xì)節(jié)決定成敗”,“蝴蝶效應(yīng)“一句話細(xì)節(jié)體現(xiàn)工作質(zhì)量也體現(xiàn)個(gè)人能力。今天復(fù)盤回顧一個(gè)個(gè)坑哭的小細(xì)節(jié),更好的迎接未來挑戰(zhàn)。

        1,窺見數(shù)據(jù)三重門

        全局著眼,登高望遠(yuǎn),窺見數(shù)據(jù)的三重門:ODS,DW,APP

        幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑

        每一層的存在分管著不同的數(shù)據(jù)工作,一起探探門里的細(xì)節(jié),把握清晰的脈絡(luò)。

        ODS層:是關(guān)注用戶重點(diǎn)事務(wù)的原始業(yè)務(wù)表,重在離線統(tǒng)計(jì)用戶細(xì)節(jié)的行為日志表。日志表可以包含業(yè)務(wù)表的相關(guān)數(shù)據(jù),但是缺乏結(jié)構(gòu),需要ETL。

        DW層:將ODS層作為直接的數(shù)據(jù)源,去建設(shè)滿足業(yè)務(wù)分析要求的數(shù)倉,進(jìn)行基礎(chǔ)整合BAS,然后開發(fā)出事實(shí)層/維度層/寬表層。其目的將一大坨數(shù)據(jù)整合分類,方便快速查詢。

        APP層:是我們熟知的應(yīng)用層,有報(bào)表,數(shù)據(jù)產(chǎn)品,API接口,特征數(shù)據(jù),專題集市,OLAP, 業(yè)務(wù)系統(tǒng)。

        三層形成上下游的環(huán)形網(wǎng)絡(luò),缺一不可。從而解耦三者的關(guān)系實(shí)現(xiàn)低耦合高內(nèi)聚任重道遠(yuǎn)。

        2,危險(xiǎn)的金字塔

        三重門可以拆解成一個(gè)倒立的金字塔,這個(gè)倒立著的金字塔是危險(xiǎn)的,總要一種搖搖欲墜的感覺,需要數(shù)據(jù)攻城獅們殫心竭慮的守護(hù)。

        幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑

        因?yàn)镺DS數(shù)據(jù)源:業(yè)務(wù)表,埋點(diǎn)日志的采集 兩大源頭,一些細(xì)枝末節(jié)的變動(dòng),牽動(dòng)ODS基礎(chǔ)層,生產(chǎn)一只黑蝴蝶,讓DW/APP層來一場雪崩。累慘數(shù)據(jù)工程師。

        業(yè)務(wù)表和日志采集:動(dòng)要有原則:

        1,能添加值不要新增列,比如在json類型中加值,不要增加額外的列名。

        2,能增加列不要新增一個(gè)表。

        3,能加一個(gè)輔助表,不要重構(gòu)原有表結(jié)構(gòu)。

        4,遵循添值,增列,副表的優(yōu)先集,提前周知變化,早做應(yīng)對。

        3,動(dòng)一下就是一萬年

        數(shù)據(jù)開發(fā)的工作流程是這樣的。

        接到一個(gè)數(shù)據(jù)需求,

        第一步,我們要分析需求的合理性,能不能做。

        第二步,我們要怎么做,哪一種方式最合適,安全快速。

        第三步,需要哪些數(shù)據(jù)資源權(quán)限。

        第四步,用SQL實(shí)現(xiàn)出自己的ETL邏輯代碼。

        第五步,測試自己的邏輯代碼,看看小單位數(shù)據(jù)是否合理。

        第六步,提交審核,生產(chǎn)數(shù)據(jù)(回溯數(shù)據(jù)很慢)。

        其實(shí)在大數(shù)據(jù)量面前,生產(chǎn)數(shù)據(jù)的過程是漫長的,需要花費(fèi)很多時(shí)間去等待。

        幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑

        第五步的測試極為重要 ,而且需要使用八倍鏡,仔細(xì)推薦,認(rèn)真核對。

        比如:統(tǒng)計(jì)當(dāng)日支付要看支付時(shí)間不要看下單時(shí)間應(yīng)為下單可以在第二天支付。還有一個(gè)小小“=”號讓統(tǒng)計(jì)意義南轅北轍。也一定要主要主要表的字段類型,不要望文生義,id不一定是數(shù)字。

        第五步一定要多花點(diǎn)時(shí)間反復(fù)校驗(yàn),不要因?yàn)樾〖?xì)節(jié)而花大時(shí)間回溯數(shù)據(jù)。

        4,借助工具

        用IDE 管理自己的ETL代碼,方便查找。

        高亮的語法提示也能更好的發(fā)現(xiàn)細(xì)節(jié)。

        代碼一定有做好格式處理,清晰可讀很重要。

        多寫wiki,磨練寫作基本功,沉淀常用的數(shù)據(jù)方法。

        工具不要多,兩個(gè)就夠了。

        幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑

        數(shù)據(jù)倉的經(jīng)典模型

        幾年的大數(shù)據(jù)開發(fā)經(jīng)驗(yàn),盤點(diǎn)下那些注意的細(xì)節(jié),避免采坑

        碼字不易,如果您覺得文章寫得不錯(cuò),

        請您 1.關(guān)注作者,您的關(guān)注是我寫作的最大動(dòng)力

        2.留下你寶貴的評論,哪怕一個(gè)字都行!

        3.私信我“大數(shù)據(jù)”

        我將與您分享一套最新的大數(shù)據(jù)學(xué)習(xí)資源和全套開發(fā)工具

        推薦閱讀:合肥汽車網(wǎng)

        免責(zé)聲明:本文僅代表企業(yè)觀點(diǎn),與新疆信息港無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
        熱門圖片
        熱門搜索