CV
Liu Chenyang
Summary
Currently employed at Red Brick University. Short biography for the left-hand sidebar
Education
- 计算机科学与技术2022-09 - 2025-06东北大学 · 硕士
- 班长
- 物联网工程2018-09 - 2022-06东北大学 · 本科
Honors and Awards
- 东北大学校长奖学金东北大学
- 东北大学一等学业奖学金(3 次)2022-2024东北大学
- 华为昇思 MindCon 个人赛二等奖
- 通义千问 AI 挑战赛 — Agent Builder 创意挑战赛 人气作品奖
- 天池 AICAS 2024 大挑战:优胜奖2024天池通用算力大模型推理性能软硬协同优化挑战赛(17/218)
Work Experience
- 后端工程师2025-07 - 至今字节跳动
Internships
- NLP 算法实习生2024-08 - 2025-06浙江清华长三角研究院
- 使用 lm-evaluation-harness 评测、分析 LLM 在 C-eval 数据集上的性能,维护评测表并形成测试流程 SOP 文档,减少后续测试工作量
- 基于 Slurm 作业调度系统,在 Arm CPU + Nvidia GPU 平台打通 Deepspeed 多机多卡训练全流程并形成 SOP 文档
- 算法研究员(实习)2024-06 - 2024-08深度赋智
- 研究不同 LLM Agent Ensemble 策略在 Code Patch 生成上的性能,设计 ensemble 策略并通过筛选生成结果,效果提升 4%
- 研究不同 LLM Debate 策略在 Code Patch 生成上的性能
- 使用 mem0 实现 LLM Code Patch 生成过程记忆,优化 prompt 与记忆历史存储,Recall@5 从 60% 提升至 85.7%
- 学术合作实习生2023-08 - 2024-04阿里云智能
- 预研大语言模型(LLM)、RAG 方法与微调技术,结合云网络业务挖掘可提升服务质量或解决业务困难的场景
- 基于 Qwen-Max、RAG 与微调设计解决方案,使用 LangChain 实现工具调用与定制,并设计向量检索方案(FAISS、text2-vec-large、multi-qa-MiniLM-L6-cos-v1)
- 基于 Gradio 搭建 Demo 服务,使用 Docker 部署与测试,汇总预研结果与 Demo 信息,撰写文档与 PPT 汇报
Competition Projects
- BetterSynth 多模态大模型数据合成挑战赛4/1066天池季军、最佳展示奖探究合成数据对多模态大模型训练的影响,并探索高效数据合成方法与策略。
- 在 baseline 基础上评估 CLIP、BLIP 的数据筛选能力并量化训练影响
- 基于探索结果设计数据合成方案,较 baseline 效果提升 150%
- BetterMixture 大模型数据混合挑战赛14/417天池优胜奖构建高质量数据混合与清洗流水线,提升训练数据质量。
- 使用开源模型与正则表达式进行标注与筛选,保证高质量数据选取
- 对垃圾数据进行打标与过滤,确保数据清洁
- 采用 simhash、minhash 与语义相似度进行多粒度去重,从数百万条数据中筛选高质量数据
- 定向混入高数学得分且包含数学等式的数据,增强模型数学能力
- 首届明厨亮灶 AI 算法大赛12/449天池分享奖面向小样本多标签分类任务,完成数据增强、模型微调与推理加速。
- 筛选高质量数据并进行数据增强,缓解小样本与多标签难点
- 微调 clip-vit-large-patch14 预训练模型,迭代优化参数提升性能
- 推理采用暴力裁剪、多物体识别与差帧法提取关键帧,并加入地板检测避免误判
- 通过并行推理与内存/显存管理优化,提升推理速度与资源利用率
Skills
深度学习框架
- PyTorch
- Transformer
- CLIP/BLIP
- CLIP 系列微调
大模型应用
- Agent(Ensemble、Debate)
- Code Patch 生成
- mem0 记忆增强
- RAG
- FAISS
- 向量检索与召回优化
- LangChain
训练与工程
- DeepSpeed 多机多卡
- Slurm
- Arm CPU + Nvidia GPU
- lm-evaluation-harness
- C-Eval(SOP)
- 正则清洗/标注
- simhash/minhash/语义去重
- Gradio
- Docker
Publications
- Paper Title Number 12009
- Paper Title Number 22010
- Paper Title Number 32015
- Paper Title Number 42024
Presentations
- Talk 1 on Relevant Topic in Your Field2012UC San Francisco, Department of TestingSan Francisco, CA, USA
- Tutorial 1 on Relevant Topic in Your Field2013UC-Berkeley Institute for Testing ScienceBerkeley, CA, USA
- Talk 2 on Relevant Topic in Your Field2014London School of TestingLondon, UK
- Conference Proceeding talk 3 on Relevant Topic in Your Field2014Testing Institute of America 2014 Annual ConferenceLos Angeles, CA, USA
Portfolio
- Portfolio item number 1
Languages
- EnglishCET-6
Interests
- Sports长跑, 乒乓球, 徒步, 羽毛球

