易斌鑫
易斌鑫
基本信息
- 基本信息: 汉族/1993年3月/男
- 学历专业: 本科/西安电子科技大学/数学与应用数学
- 电子邮箱: ybxlife@foxmail.com
- 手机电话: 18710849538
工作经历
- 数据开发工程师 西安彩视迅捷技术有限公司 2022年3月 ~ 2022年 5月
- 软件开发工程师 北京外企德科人力资源服务有限公司 2021年6月 ~ 2021年11月
- 软件开发工程师 迅捷联动科技有限公司 2018年1月 ~ 2021年 5月
- 软件开发工程师 西安优云软件有限公司 2017年6月 ~ 2017年12月
- 软件开发工程师 西安导学教育科技有限公司 2014年7月 ~ 2017年 5月
项目经验
大数据平台(2018年1月 - 2021年5月)
- 从0到1搭建并运维大数据技术体系,为用户画像分群、OLAP分析、推荐等业务提供服务;
- 设计实施数据平台技术方案(Hadoop、Spark、Kafka),开发离线ETL工具组件、搭建Airflow任务调度系统、设计元数据管理系统;
- 优化日志中间件Fluentd、Canal服务,搭建并维护Kafka集群,搭建Kafka Stream流式数据处理服务;
- 数据分层建模及离线数据分析模型(ROI、LTV)开发,完善数据仓库集成、即时查询及可视化功能;
- 基于Spark GraphX开发千万级N度社交关系推荐数据计算任务。
AB实验平台(2020年3月 - 2020年9月)
- 设计AB实验分流系统架构,实现实验分层、流量分域、白名单规则、用户受众规则;
- 采用Redis、Mysql、ElasticSearch技术开发实验管理服务,发布到阿里云自建K8s环境;
- 应用多实验分层,互斥实验分组和简单的流量百分比自动调整,完成流量及事件指标配置和统计;
- 减少业务开发的工作量,仅一次API调用,使产品业务优化探索效率提升一倍。
内容推荐系统(2019年5月 - 2020年3月)
- 开发特征工程程序,开发训练FM模型,提升AUC指标至0.9;
- 开发推荐服务端API,实现多路召回、重排序及冷启动策略,提高内容分发效率;
- 实现模型分布式、增量训练和小时级更新,通过Faiss、Redis提高Embedding向量检索速度;
- 基于BERT实现word2vec,增加内容文本I2I召回,提升内容主题相似度。
日志收集监控服务(2016年7月 - 2017年5月)
- 研究和实践ELK技术栈,使用轻量级Filebeat工具进行日志收集,减轻服务器压力;
- 编写Nginx、Tomcat的Logstash日志处理器,完成日志格式预处理,细化Kibana数据看板;
- 搭建CDH数据集群,实现业务数据集成处理,搭建Solr分布式索引服务。
K12题库搜索系统(2014年9月 - 2016年6月)
- 优化Lucene索引和OCR模糊搜索算法,提高图像处理效果和上传速度;
- 搭建Solr分布式搜索系统,完善索引词典建设,编写LaTeX分词算法,提升10倍搜索请求QPS;
- 实现HTML+LaTeX文本内容图片、PDF、DOCX格式转码服务,通过多任务队列实现并发快速处理千万任务;
- 参与翻译Solr使用指南,研究Pandoc源码,Patch开源项目。
我的技能
- 外语: 英语CET-6
- Java、Scala、Python、Shell、Linux、Docker
- Hadoop、Spark、Kafka、Airflow、Canal、Spring
教育经历
- 西安电子科技大学 本科 / 数学与应用数学 2010.09 - 2014.07