易斌鑫

易斌鑫

基本信息

基本信息: 汉族/1993年3月/男
学历专业: 本科/西安电子科技大学/数学与应用数学
电子邮箱: ybxlife@foxmail.com
手机电话: 18710849538

工作经历

数据开发工程师　　　　　　西安彩视迅捷技术有限公司　　　　　　　2022年3月～ 2022年 5月
软件开发工程师　　　　　　北京外企德科人力资源服务有限公司　　　2021年6月～ 2021年11月
软件开发工程师　　　　　　迅捷联动科技有限公司　　　　　　　　　2018年1月～ 2021年 5月
软件开发工程师　　　　　　西安优云软件有限公司　　　　　　　　　2017年6月～ 2017年12月
软件开发工程师　　　　　　西安导学教育科技有限公司　　　　　　　2014年7月～ 2017年 5月

项目经验

大数据平台（2018年1月 - 2021年5月）

从0到1搭建并运维大数据技术体系，为用户画像分群、OLAP分析、推荐等业务提供服务；
设计实施数据平台技术方案（Hadoop、Spark、Kafka），开发离线ETL工具组件、搭建Airflow任务调度系统、设计元数据管理系统；
优化日志中间件Fluentd、Canal服务，搭建并维护Kafka集群，搭建Kafka Stream流式数据处理服务；
数据分层建模及离线数据分析模型（ROI、LTV）开发，完善数据仓库集成、即时查询及可视化功能；
基于Spark GraphX开发千万级N度社交关系推荐数据计算任务。

AB实验平台（2020年3月 - 2020年9月）

设计AB实验分流系统架构，实现实验分层、流量分域、白名单规则、用户受众规则;
采用Redis、Mysql、ElasticSearch技术开发实验管理服务，发布到阿里云自建K8s环境；
应用多实验分层，互斥实验分组和简单的流量百分比自动调整，完成流量及事件指标配置和统计；
减少业务开发的工作量，仅一次API调用，使产品业务优化探索效率提升一倍。

内容推荐系统（2019年5月 - 2020年3月）

开发特征工程程序，开发训练FM模型，提升AUC指标至0.9；
开发推荐服务端API，实现多路召回、重排序及冷启动策略，提高内容分发效率；
实现模型分布式、增量训练和小时级更新，通过Faiss、Redis提高Embedding向量检索速度；
基于BERT实现word2vec，增加内容文本I2I召回，提升内容主题相似度。

日志收集监控服务（2016年7月 - 2017年5月）

研究和实践ELK技术栈，使用轻量级Filebeat工具进行日志收集，减轻服务器压力；
编写Nginx、Tomcat的Logstash日志处理器，完成日志格式预处理，细化Kibana数据看板；
搭建CDH数据集群，实现业务数据集成处理，搭建Solr分布式索引服务。

K12题库搜索系统（2014年9月 - 2016年6月）

优化Lucene索引和OCR模糊搜索算法，提高图像处理效果和上传速度；
搭建Solr分布式搜索系统，完善索引词典建设，编写LaTeX分词算法，提升10倍搜索请求QPS；
实现HTML+LaTeX文本内容图片、PDF、DOCX格式转码服务，通过多任务队列实现并发快速处理千万任务；
参与翻译Solr使用指南，研究Pandoc源码，Patch开源项目。

我的技能

外语：英语CET-6
Java、Scala、Python、Shell、Linux、Docker
Hadoop、Spark、Kafka、Airflow、Canal、Spring

教育经历

西安电子科技大学　　　　　　　　本科 / 数学与应用数学　　　　　　　　2010.09 - 2014.07