易斌鑫
易斌鑫
个人信息
- 易斌鑫/男/1993年/28
- 西安电子科技大学/本科/数学系/2010-2014
- 工作年限: 7年
- 期望职位: JAVA开发工程师
- 期望薪资: 20k
- 期望城市: 西安
- 18710849538
- ybxlife@foxmail.com
工作经历
迅捷联动(北京)科技有限公司(2018年1月 ~ 至今)
西安优云软件有限公司(2017年6月 ~ 2017年12月)
西安博创软件有限公司(2014年7月 ~ 2017年5月)
工作项目
数据仓库 2018/01 - 2021/01
-
K12题库搜索系统(QSS)
负责solr分布式搜索集群建设,进行词典建设和LaTeX公式分词算法优化.将搜索响应从3s提升至200ms,稳定服务C端每日100万PV,文本搜索查全率提升到90%,图像识别搜索差准率提升至70%.与团队分享倒排索引的原理与向量空间模型等技术知识.系统数据量从百万级增长至千万级,从1G索引上升到现在10G.同时,给其它有搜索需求的项目快速提供实现及接口.
-
自动化部署与分布式架构(DevOps)
首先自建Maven仓库,方便代码共享,加速项目开发,然后搭建Jenkins自动部署平台,实现应用快速自动化部署.另外,搭建GitLab代码仓库,实现代码内部分享与CodeReview;学习git-flow工作流,规划团队协作;并引入issue协作方式,使得责任明确及问题持续跟踪.并尝试采用GitLab-CI完成自动打包与自动测试. 鉴于团队项目业务复杂度提升,由垂直应用架构向分布式架构升级.我推荐并使用Dubbox分布式RPC框架.和团队学习新的技术并抽取核心业务,完成系统核心服务的分布式升级.
-
日志收集与监控系统(LOGs)
项目采用storm流式计算实时处理用户日志并加工,后通过flume收集系统,最终存储至hadoop集群.我在此项目搭建了CDH5.7分布式集群,并通过hive进行数据统计分析,为用户推荐项目提供数据服务.该项目解决就日志系统采用关系型数据库存储所面临的容量及利用问题.期间,同时维护6台云Linux主机,目前总数据量已达300G. 使用流行的ELK组合框架,为核心服务提供日志实时监控功能,填补服务访问日志监控空白,随时了解服务运行状态和服务压力,使得尽早发现和解决服务问题.
-
文档转码自动化(Converter)
项目主要解决复杂HTML内容(包含LaTeX,Markdown等)到文档(DOC,DOCX,PDF,PNG)的自动化格式转换难题.由于我最熟悉LaTeX语法和MathJax渲染工具的后台开发,项目由我负责完成.最大问题为渲染问题和排版问题.对于问题一,我实验过Webkit和V8渲染引擎,效果不尽理想,而且部分引擎存在浏览器应用必要条件,部分引擎内存和CPU消耗太大.最终采用了Linux加XVFB虚拟显示方案,解决了网页至图片的转码需求.排版问题包括Office文档及PDF排版问题,通过一月的PANDOC,Office XML和Xelatex排版系统的学习和实验,最终达到90+%的满意效果.
- 搜索
- 编辑OA系统
- 云主机
- 导学号后台,教育,商城
- NoSQL数据库分布式
其它项目
- 自由搭
技能
java,spring,solr,linux,redis