大數據架構師職責
1.負責產品級業務系統架構(如業務數據對象識別,數據實體、數據屬性分析,數據標準、端到端數據流等)的設計與優化。協助推動跨領域重大數據問題的分析、定位、解決方案設計,從架構設計上保障系統高性能、高可用性、高安全性、高時效性、分布式擴展性,并對系統質量負責。
2.負責云數據平臺的架構設計和數據處理體系的優化,推動云數據平臺建設和持續升級,并制定云數據平臺調用約束和規范。
3.結合行業應用的需求負責數據流各環節上的方案選型,主導云數據平臺建設,參與核心代碼編寫、審查;數據的統計邏輯回歸算法、實時交互分析;數據可視化方案等等的選型、部署、集成融合等等。
4.對云數據平臺的關注業內技術動態,持續推動平臺技術架構升級,以滿足公司不同階段的數據需求。
任職要求:
1.熟悉云計算基礎平臺,包括Linux(Ubuntu/CentOS)和KVM、OpenStack/K8S等基礎環境,熟悉控制、計算、存儲和網絡;
2.掌握大型分布式系統的技術棧,如:CDN、負載均衡、服務化/異步化、分布式緩存、NoSQL、數據庫垂直及水平擴容;熟悉大數據應用端到端的相關高性能產品。
3.精通Java,Python,Shell編程語言,精通SQL、NoSQL等數據庫增刪改查的操作優化;
4.PB級別實戰數據平臺和生產環境的實施、開發和管理經驗;
5.熟悉Docker等容器的編排封裝,熟悉微服務的開發和日常調度;
6.計算機、軟件、電子信息及通信等相關專業本科以上學歷,5年以上軟件工程開發經驗,2年以上大數據架構師工作經驗。
大數據架構師職責篇2
1.深刻理解政府行業業務模式,構建政府行業的數據模型,制定公司大數據技術發展路線;
2.對接業務研究和技術部門,主動搜集和轉化需求,組織數據中心業務開發,進行數據相關產品需求分析和設計;
3.搭建數據倉庫,研發數據庫管理系統,搜集、提取、處理業務積累的海量數據,開展數據分析和挖掘;
4.根據公司戰略和發展需要,規劃數據中心重點工作和任務;落實部門人員、事務管理,開展跨部門、跨地區協作,協助對外交流與合作。
職位要求:
1.5年以上相關工作經驗,有團隊管理和項目管理經驗者優先;
2.了解政府運作機制,掌握財政行業知識,有電子政務行業經驗者優先;
3.熟練掌握使用Java或Python,精通數據庫查詢語言如SQL,Oracle等,在機器學習模型和算法方向有應用經驗者優先;
4.具備數據中心產品策劃整體思維,有大數據處理、分析、挖掘經驗者優先;
5.邏輯思維嚴密,具備業務抽象、分解和標準化的能力,口頭和書面表達優秀;
6.有較強的大局意識和良好的團隊合作意識,富有領導力,具備優秀的人際交往和溝通能力。
大數據架構師職責篇3
1.負責公司大數據平臺的設計和開發,負責spark,hadoop,flink等云計算平臺的開發和優化;制定數據架構規范,進行核心代碼編寫,指導團隊落地;
2.負責數據基礎架構和數據處理體系的升級和優化,技術難題攻關,持續提升核心系統性能,保證系統的安全、穩定、高效運行
3.設計并實現對BI分析、數據產品開發、算法開發的系統性支持
4.研究未來數據模型和計算框架的創新與落地,包括但不限于以下領域:大規模數據實時化、研發模式敏捷化、數據計算框架輕量化、數據模型組織方式業務化等方面參與制定并實踐團隊的技術發展路線
5.建立良好的公司內外的業界技術影響力;參與培養未來數據人才;有效輔導團隊,提升數據研發能力
任職要求:
1.有很強的數據設計抽象能力,善于從復雜的數據問題中找到關鍵路徑,能夠開發創新而實際的分析方法以解決復雜的商業問題
2.有作為技術負責人系統化解決問題的成功案例;有海量數據建模實踐經驗優先
3.熟練掌握Hadoop、Spark、Flink、HBase的原理特性以及適用場景,精通流式計算開發,有開源二次開發經驗者優先,有NLP數據處理經驗者優先
4.性格積極樂觀,誠信,能自我驅動,有較強的語言表達能力;具備強烈的進取心、求知欲及團隊合作精神;具有良好的溝通、團隊協作、計劃和創新的能力
5.本科以上學歷,扎實的計算機專業基礎,有5年以上大數據平臺開發經驗;
大數據架構師職責篇4
1)負責大數據平臺系統架構設計、核心開發工作(Hadoop&Spark技術方向),基于業務場景設計最優的系統解決方案。
2)構架支持大數量級的數據的大數據平臺系統,及相關監控,拓展系統設計及實現。
3)利用Hadoop、Spark等大數據技術對海量數據進行處理,支持BI和數據科學(建模)的應用實現。
4)對現有系統的進行架構深入分析及系統優化,進一步提升系統的性能及數據處理能力。
任職資格
1)統招本科或以上學歷,計算機相關專業,5年以上軟件開發經驗、3年以上大數據項目經驗。
2)具備較豐富的大數據平臺相關構建,維護及調優經驗,有大數據量級下的大數據集市相關經驗。
3)具備較豐富的基于Hadoop或Hive或Spark等大數據處理項目經驗,具備一定的數據挖掘經驗。
4)具有阿里云的EMR(emapreduce)的經驗者優先考慮。
5)具有良好的業務理解、溝通和協作能力,具有較強的學習和總結能力。
6)優秀的團隊合作精神、誠實、勤奮、嚴謹,敢于接受挑戰。
7)機器學習技術、數據挖掘經驗豐富者優先考慮。
大數據架構師職責篇5
負責大數據平臺的規劃和搭建、完成大數據平臺的日常運營工作,為數據分析和展現提供支持;
對系統框架相關技術和業務進行培訓,并負責核心代碼編寫,指導團隊開發及解決出現的系統問題;
參與基于大數據平臺的創新業務場景進行數據產品的架構設計,負責數據產品的研發交付;
負責處理大數據平臺的疑難問題,為數據團隊提供可靠的技術支持;
負責數據質量、穩定性等數據管理,數據內部共享融通的數據平臺,讓數據標準更規范、數據獲取更高效;
及時跟進大數據領域新技術并分享,提升團隊技術能力。
任職要求:
本科或以上學歷,5年以上數據系統建設經驗,3年以上大數據架構設計經驗;
精通java,python,scala等一種大數據開發語言,熟悉Hadoop生態圈,包括但不限于hdfs,hive,spark,有豐富的大數據項目的實踐經驗;
具備創新精神,條理清晰,溝通表達和邏輯思維能力強;
熟悉數據倉庫的設計和開發,對數據架構有深入的了解和具備相關的項目實踐經驗優先;
對SQLonHadoop的開源查詢引擎(如Presto、ApacheDrill)原理有深入研究優先;
有敏捷大數據和數據可視化實踐經驗優先。
大數據架構師職責篇6
1.負責公司大數據底層框架的整體架構設計,結合公司實際業務情況進行技術選型及大數據戰略規劃;
2.負責統一數據平臺項目的整體評估、設計、架構及關鍵模塊的開發,不斷提升系統的穩定性和效率;
3.負責架構優化及系統關鍵模塊的設計開發,協助團隊解決開發過程中的技術難題;
4.建立良好的公司內外的業界技術影響力;有效輔導團隊,提升數據研發能力;
任職要求:
1.從事大數據項目相關開發和設計2年以上經驗;有作為技術負責人系統化解決問題的成功案例;有海量數據實踐經驗優先;
2.擁有一定的算法和數據結構基礎;有很強的數據設計抽象能力,善于從復雜的數據問題中找到關鍵路徑;
3.熟悉目前正在發展的大數據分布式平臺前沿技術的應用;包括但不僅僅限于:hadoop、storm、spark、等;
4.良好的邏輯思維能力,良好的業務解讀能力,懂電力或通信業務優先;
5.具有鉆研精神,樂于接受挑戰;
大數據架構師職責篇7
1、負責大數據平臺架構的評估、規劃和設計;負責海量數據采集、處理及存儲、應用方案的技術選型及架構實現;
2、開發大數據平臺的核心代碼,負責大數據平臺的搭建,完成系統調試、集成與實施,技術難題的解決,保證大數據產品的上線運行;
3、根據業務需求持續優化數據架構,保證產品的可靠性、穩定性;
4、指導開發人員完成數據模型規劃建設,分析模型構建及分析呈現,分享技術經驗;
5、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
6、深入研究大數據相關技術和產品,跟進業界先進技術;
任職資格:
1.本科及以上學歷,數學或計算機相關專業畢業,不少于5年的工作經驗,具有扎實的計算機基礎理論知識;
2.有3年以上Hadoop、Spark、Hbase平臺性能調優經驗;熟悉sparkstreaming等實時計算技術
3.熟悉hive、hbase、storm、mahout、flume、ElasticSearch、Spark、Kafka等,具備實際項目設計及開發經驗;
4.熟悉sparkstreaming等相關的實時計算技術;
5.熟悉大規模數據挖掘、機器學習、自然語言處理、分布式計算中一項或多項技術,并具備多年的實際工作經驗;
6.熟悉主流關系型數據庫(Oracle、MySql)、NoSql數據庫,熟悉pl/sql編程;精通Linux操作系統,熟練使用Java;熟悉常用框架.如Spring、MyBatis等;
7.具有較強的執行力,高度的責任感、很強的學習、溝通能力,能夠在高壓下高效工作;
大數據架構師職責篇8
職責
1、負責公司大數據平臺的整體架構設計,包含數據收集、數據存儲、數據挖掘、數據輸出;
2、負責規劃從數據源到數據應用的整體流程,并參與用戶產品和數據產品的決策;
3、負責海量數據分析、用戶行為分析,構建用戶數據模型;
4、負責解決核心技術問題,對技術方案進行決策;
5、技術團隊管理。
6、熟悉手機IOS、安卓系統APP開發
任職資格
1、計算機相關專業畢業,本科以上學歷;
2、5年以上相關工作經驗,具備軟件產品架構設計經驗,熟練掌握高性能、高擴展性架構設計方法;
3、熟練掌握java或c++任意一門語言、熟悉linux操作系統;
4、熟悉Hadoop/MR/Hbase/Mahout/Spark等大數據技術,并能夠基于上述項目開發大數據相關應用;
5、熟悉基本數據挖掘方法和技術;
6、強烈的敬業精神,良好的溝通與協調能力,能有效組織協調團隊完成各類開發工作;
7、熱愛技術,相信數據的價值,對大數據有深刻的理解。
大數據架構師職責篇9
1.負責企業數據中心建設,設計數據邏輯模型和物理模型,并完成相關開發
2.梳理公司各業務線常用的指標和維度,統一指標定義口徑
3.根據數據應用開發和數據分析需求,設計數據倉庫信息層模型,提高數據開發的效率
4.負責數據模型的運營和優化,及時響應業務邏輯變更,保證模型的數據質量和穩定性
5.負責公司數據標簽體系的建設,并推動標簽體系在實際業務場景中落地
崗位要求:
1.5年以上DW/BI數據架構設計、模型設計和性能調優等相關經驗
2.有較強的數據分析能力,精通數據倉庫架構,熟悉Erwin或PowerDesigner建模工具
3.精通一種主流關系數據庫(如mysql等),熟悉Hive開發
4.有電商業務經驗,元數據管理,數據質量管理或標簽體系搭建經驗者優先
5.優秀的協調溝通與團隊協作能力,極強的責任心,能承受一定的工作壓力,認同企業文化和團隊價值
大數據架構師職責篇10
1、數據分析軟件平臺架構搭建
2、負責深度學習核心框架或高性能后臺服務系統的架構設計工作,包括系統總體規劃、架構設計、系統分析、軟件實現、性能優化;
3、指導開發人員開發,并解決系統出現的問題,理解物業需求;
4、制定開發計劃和控制開發進度,負責指導研發團隊開展設計工作;
任職要求:
1、碩士以上,計算機或先關專業;
2、5年左右軟件開發經驗,含3年以上系統分析、設計經驗,有大型軟件項目大型軟件項目;有中大型互聯網企業數據庫架構設計及管理經驗,
3、具備良好的組件級建模能力,熟悉HTTP、TCP等協議
4、熟練使用UML進行軟件架構設計,至少精通EA,RATIONAL,VISIO等一種設計工具.
5、精通至少一種編程語言,熟悉Linux相關技術,能獨立在上面進行開發、測試和部署
6、深入理解數據庫、數據倉庫、大數據、分布式體系架構和關鍵技術
大數據架構師職責篇11
職責
1、參與打造數據中內容的規劃、設計、開發和優化工作,實現高質量數據的互通與共享;
2、參與數據模型體系構建及數據主題設計和開發,搭建離線、實時數據公共層;
3、參與數據產品與應用的數據研發,發掘數據商業價值,打造極致體驗的數據產品;
4、深入理解數據產品的使用場景,為業務方在可用性、成本上做更好的設計做參考;
5、團隊成員的搭建與培養,任務劃分,進度監控,代碼規范,質量保證。
任職要求
1、熟悉數據倉庫建模理論,3年以上相關領域實踐經驗;
2、Hadoop、Hive、Hbase、Storm、Spark等技術框架;
3、精通Java、Python、Scala、go等開發語言中的1到2種;
4、熟練使用Python/Java/scala或其他語言進行復雜業務邏輯的數據處理工作,具備海量數據處理以及性能優化的能力;
5、對MySQL、Redis、HBase等數據庫有一定的了解和使用經驗;
6、對olap,多維分析及kylin熟悉的更好;
7、思路清晰,具備良好的溝通能力和理解能力,較強的學習能力以及快速解決問題的能力;
8、對新技術,新事物有很好的探索和求知欲;
9、熟悉常規的機器學習算法:降維(PCA、SVD)、SVM、邏輯回歸(LogisticsRegression)、決策樹(GBDT、RandomForest)、關聯規則(Apriori、FP-Growth)、聚類(K-Means)等優先。
大數據架構師職責篇12
1.能夠帶領技術人員基于hadoop平臺進行海量數據應用系統開發;
2.負責結構化和非結構化數據的解析和清洗,海量數據查詢和報表展現;
3.負責超大規模數據平臺的搭建、維護和優化;
4.負責大數據采集、存儲框架研究,參與在線或離線數據存儲模型設計;
5.負責大數據平臺新技術的開發使用和性能優化,測試。
任職資格:
1.計算機相關專業本科及以上學歷;
2.熟悉hadoop相關各種開源項目,比如HDFS/Hive/Hbase等有實際應用。(5年以上開發經驗者優先);
3.兩年以上熟練編寫mapreduce代碼經驗,有三年以上網絡日志分析、ETL經驗。熟悉日志分析框架chukwa,flume,scribe者優先;
4.兩年以上海量數據存儲的安裝部署、優化、二次開發經驗,對大規模數據存儲、傳輸、處理等有豐富的經驗;
5.在數據挖掘、數據密集型處理、分布式計算、網格計算領域有深入理論基礎;
6.具有較強的文檔撰寫能力,較強的團隊精神和合作精神,對工作有熱情,能承受壓力。
大數據架構師職責篇13
1、負責spark,hadoop,flink等開發和優化。
2、參與前期需求溝通和分析,以產品化開發的思維,完成需求分解和數據架構設計。
3、與研發和數據科學家合作保證產品定義清晰,按時完成產品上線。
4、能夠洞察市場狀況,與各部門合作轉化為基于大數據挖掘的新策略或方案.
5、主動創造和發掘新的基于大數據挖掘產品商業模式.
任職要求:
1、全日制本科及以上學歷,計算機軟件相關專業,5年以上開發經驗,3年以上架構經驗
2、精通hadoop/MapReduce/Spark/Hbase/Flink/Hive/R/Mahout等分布式數據存儲和分布式計算平臺原理,流式計算開發,有開源二次開發經驗者優先。
3、精通大數據挖掘、機器學習.熟練掌握Java/Perl/Python至少一種編程語言。
4、具有數據挖掘和分析、機器學習等項目實施相關經驗者優先;
5、良好的跨部門溝通合作能力,解決不同觀點能力并取得結果。具備敏銳的互聯網產品理解力,學習能力和邏輯思維能力強;
6、較強的自我驅動力、推動和協調能力,強烈的責任心和團隊合作精神;
大數據架構師職責篇14
1、負責大數據平臺的架構設計、核心代碼開發等任務;根據項目要求編寫相關技術文檔;
2、負責大數據平臺的架構評審,代碼評審,上線評審;參與數據應用需求、設計、審核和評審;
3、負責核心模塊研發,負責大數據平臺的搭建,完成系統調試、集成與實施;
4、負責建立和維護大數據平臺技術標準規范,指導開發人員編寫代碼;
任職要求:
1、本科及以上計算機相關專業畢業;
2、精通離線和實時數據處理流程,掌握離線數據處理框架hive、impala、spark-sql等,掌握實時數據處理常用技術工具,包括Storm、SparkStreaming等;
3、熟悉大數據技術生態圈,精通大數據技術架構,有大數據平臺構建經驗;
4、掌握常見數據流接入工具,包括Flume、kafka等;
5、熟練掌握基本的Linux操作系統和某種腳本語言編程(如Shell等);
6、掌握一種或以上實時處理語言,如JAVA、SCALA、PYTHON等,有SCALA經驗者優先;
7、有實際大規模數據(TB級以上)處理經驗優先;
大數據架構師職責篇15
1、負責大數據平臺資源規劃、權限控制、運維架構設計,為各產品業務提供穩定、高效、安全的運行環境;
2、負責實時,離線數據分析處理及實時平臺的建設和搭建
3、熟悉Flink流式計算引擎的使用以及源碼原理,并且有相關的流式處理平臺的經驗。
4、Java基礎扎實,熟練掌握垃圾回收,網絡,多線程編程,了解python或scala
5、負責大數據平臺技術架構、數據架構的分析與設計;
大數據架構師職責篇16
1、負責規劃科技大數據平臺及科技數據入庫自動化的方案設計;
2、負責大數據平臺的開發和維護,以及對外服務接口的開發;
3、負責大數據平臺的優化和改進工作。
任職要求
1、計算機相關專業本科及以上學歷,5年以上開發經驗,其中3年以上為互聯網、大數據相關的開發經驗;
2、熟知Hadoop生態圈體系,精通Hadoop/Spark/Storm/Kafka中的一項或幾項,深刻理解MapReduce的運行原理和機制,有MPI經驗者尚佳;
3、熟悉Elasticsearch、Redis、Hbased等相關數據庫的構建和操作,尤其是數據庫集群的構建和操作,熟悉Neo4j者尚佳;
4、具有機器學習相關項目經驗者優先。
大數據架構師職責篇17
職責:
1、對業務需求深入分析,從而進行大數據平臺核心應用的架構設計、開發和技術支持;
2、規劃業務應用系統和基礎平臺的技術架構,參與需求分析、建模、架構設計、技術決策以及詳細設計;
3、把握復雜系統的設計,確保系統的架構質量,編寫核心部分代碼;
4、帶領團隊攻克例如大數據量、高并發、高穩定性等帶來的各種挑戰及技術難關;
5、在大數據平臺建設路線圖指導下,進行架構實施和交付物投遞,同時確保研發質量和方向的準確性;
6、進行團隊技術的培訓和梯隊建設崗位要求;
任職條件:
1、本科或以上學歷,計算機相關專業,8年以上研發經驗,3年以上大數據平臺相關工作經驗;
2、精通Java開發技術,熟悉Shell、Scala語言和PYTHON優先;
3、編程基礎扎實,熟悉I/O、多線程、集群等基礎框架和原理,熟悉分布式、緩存、消息等機制;
4、熟悉常用設計模式,代碼評審規則,單元測試,持續集成;
5、熟悉AWS云服務或阿里云服務;
6、熟悉容器技術原理、生態系統,熟悉Docker、Mesos、Kubernetes等容器系統、大規模容器資源調度系統、分布式應用生命周期。
大數據架構師職責篇18
1、負責公司的大數據處理框架的研發設計工作,梳理可實現方案和技術規范;
2、開發、完善公司大數據平臺;參與公司離線、實時大數據處理系統的設計、開發、測試及多個業務模塊的自動化集成;
3、負責業務平臺數據統計分析模塊的設計與規劃;
4、負責公司產品研發過程中的數據及存儲設計;
5、帶領和培養團隊完成組織分解的目標;
任職要求:
1、統招本科及以上學歷,計算機、軟件工程相關專業,至少8年以上工作經驗,5年以上大數據開發經驗;
2、熟悉Java、Hadoop、HDFS、Hive、HBase、Spark、Storm、Flume等相關技術的基礎架構
3、熟悉數據倉庫,數據算法,分布式計算技術理論,具有大數據整體系統架構設計經驗;
4、熟悉Linux系統,熟練使用shell/perl/python腳本處理問題;
5、對深度學習框架(Tensorflow)和機器學習(svm隨機深林貝葉斯等)有一定了解的優先;
6、能夠組織項目開發組協同工作,包括團隊溝通、計劃、開發環境管理等
大數據架構師職責篇19
1.負責整個大數據平臺架構的設計和構建;
2.負責構建大數據平臺的數據交換、任務調度等通用平臺;
3.制定開發、測試、實施、維護的標準和規范,指導和培訓工程師,不斷提升團隊能力。
4.參與系統需求分析、架構設計、技術選型、應用設計與開發以及測試與部署,負責編寫核心部分代碼。
5.持續挑戰新的技術方向,攻克大數據量、高并發、高可用、可擴展等技術難點。
任職要求:
1.3年以上大數據架構經驗,豐富的數據倉庫、數據挖掘、機器學習項目經驗
2.大規模數據處理的架構和設計實戰經驗
3.精通Spark、MR,熟練HDFS、Yarn、Hbase、Hive、MongoDB,熟悉Kafka、Redis、Storm、Mahout、Flume、ElasticSearch、GraphDB(NEO4J或其他)等,并具有豐富的大型數據平臺工程經驗
4.深刻理解大數據處理(流計算,分布式計算,分布式文件系統,分布式存儲等)相關技術和實現方法
5.熟悉主數據、元數據、數據質量等企業數據管理相關的體系和方法,熟練Linux/Unix平臺上的開發環境
6.本科或以上學歷,計算機軟件或相關專業,豐富的java開發經驗和互聯網背景優先。
7.具有比較強的問題分析和處理能力,有比較優秀的動手能力,熱衷技術,精益求精
大數據架構師職責篇20
職責:
1、負責大數據倉庫、數據集市的規劃及實現,負責大數據中臺的設計和核心開發工作;
2、負責數據基礎架構和數據處理體系的升級和優化,不斷提升系統的穩定性和效率,為公司的業務提供大數據底層平臺的支持和保證;
3、大數據平臺的數據采集、處理、存儲以及挖掘分析的架構實現;
4、研究未來數據模型和計算框架的創新與落地,包括但不限于以下領域:大規模數據實時化、研發模式敏捷化、數據計算框架輕量化、數據模型組織方式業務化等方面,參與制定并實踐團隊的技術發展路線
任職資格:
1、精通數據建模、數據標準管理、元數據管理、數據質量管理;
2、有作為技術負責人系統化解決問題的成功案例;有海量數據實踐經驗優先;
3、熟悉目前正在發展的大數據分布式平臺前沿技術的應用;包括但不僅僅限于:hadoop、flink、spark等;
4、性格積極樂觀,誠信,能自我驅動,有較強的語言表達能力;具備強烈的進取心、求知欲及團隊合作精神;具有良好的溝通、團隊協作、計劃和創新的能力;在數據業界有一定的影響力優先,具有風控經驗背景的人優先;
5、具備獨立的深度思考能力,給出結合實際情況的較為理想的技術解決方案。