CV

Liu Chenyang

liuchenyang404@gmail.com
Beijing, CN

Summary

Currently employed at Red Brick University. Short biography for the left-hand sidebar

Education

  • 计算机科学与技术
    2022-09 - 2025-06
    东北大学 · 硕士
    • 班长
  • 物联网工程
    2018-09 - 2022-06
    东北大学 · 本科

Honors and Awards

  • 东北大学校长奖学金
    东北大学
  • 东北大学一等学业奖学金(3 次)
    2022-2024
    东北大学
  • 华为昇思 MindCon 个人赛二等奖
  • 通义千问 AI 挑战赛 — Agent Builder 创意挑战赛 人气作品奖
  • 天池 AICAS 2024 大挑战:优胜奖
    2024
    天池
    通用算力大模型推理性能软硬协同优化挑战赛(17/218)

Work Experience

  • 后端工程师
    2025-07 - 至今
    字节跳动

Internships

  • NLP 算法实习生
    2024-08 - 2025-06
    浙江清华长三角研究院
    • 使用 lm-evaluation-harness 评测、分析 LLM 在 C-eval 数据集上的性能,维护评测表并形成测试流程 SOP 文档,减少后续测试工作量
    • 基于 Slurm 作业调度系统,在 Arm CPU + Nvidia GPU 平台打通 Deepspeed 多机多卡训练全流程并形成 SOP 文档
  • 算法研究员(实习)
    2024-06 - 2024-08
    深度赋智
    • 研究不同 LLM Agent Ensemble 策略在 Code Patch 生成上的性能,设计 ensemble 策略并通过筛选生成结果,效果提升 4%
    • 研究不同 LLM Debate 策略在 Code Patch 生成上的性能
    • 使用 mem0 实现 LLM Code Patch 生成过程记忆,优化 prompt 与记忆历史存储,Recall@5 从 60% 提升至 85.7%
  • 学术合作实习生
    2023-08 - 2024-04
    阿里云智能
    • 预研大语言模型(LLM)、RAG 方法与微调技术,结合云网络业务挖掘可提升服务质量或解决业务困难的场景
    • 基于 Qwen-Max、RAG 与微调设计解决方案,使用 LangChain 实现工具调用与定制,并设计向量检索方案(FAISS、text2-vec-large、multi-qa-MiniLM-L6-cos-v1)
    • 基于 Gradio 搭建 Demo 服务,使用 Docker 部署与测试,汇总预研结果与 Demo 信息,撰写文档与 PPT 汇报

Competition Projects

  • BetterSynth 多模态大模型数据合成挑战赛
    4/1066
    天池季军、最佳展示奖
    探究合成数据对多模态大模型训练的影响,并探索高效数据合成方法与策略。
    • 在 baseline 基础上评估 CLIP、BLIP 的数据筛选能力并量化训练影响
    • 基于探索结果设计数据合成方案,较 baseline 效果提升 150%
  • BetterMixture 大模型数据混合挑战赛
    14/417
    天池优胜奖
    构建高质量数据混合与清洗流水线,提升训练数据质量。
    • 使用开源模型与正则表达式进行标注与筛选,保证高质量数据选取
    • 对垃圾数据进行打标与过滤,确保数据清洁
    • 采用 simhash、minhash 与语义相似度进行多粒度去重,从数百万条数据中筛选高质量数据
    • 定向混入高数学得分且包含数学等式的数据,增强模型数学能力
  • 首届明厨亮灶 AI 算法大赛
    12/449
    天池分享奖
    面向小样本多标签分类任务,完成数据增强、模型微调与推理加速。
    • 筛选高质量数据并进行数据增强,缓解小样本与多标签难点
    • 微调 clip-vit-large-patch14 预训练模型,迭代优化参数提升性能
    • 推理采用暴力裁剪、多物体识别与差帧法提取关键帧,并加入地板检测避免误判
    • 通过并行推理与内存/显存管理优化,提升推理速度与资源利用率

Skills

深度学习框架

  • PyTorch
  • Transformer
  • CLIP/BLIP
  • CLIP 系列微调

大模型应用

  • Agent(Ensemble、Debate)
  • Code Patch 生成
  • mem0 记忆增强
  • RAG
  • FAISS
  • 向量检索与召回优化
  • LangChain

训练与工程

  • DeepSpeed 多机多卡
  • Slurm
  • Arm CPU + Nvidia GPU
  • lm-evaluation-harness
  • C-Eval(SOP)
  • 正则清洗/标注
  • simhash/minhash/语义去重
  • Gradio
  • Docker

Publications

  • Paper Title Number 1
    2009
    Journal 1
    This paper is about the number 1. The number 2 is left for future work.
  • Paper Title Number 2
    2010
    Journal 1
    This paper is about the number 2. The number 3 is left for future work.
  • Paper Title Number 3
    2015
    Journal 1
    This paper is about the number 3. The number 4 is left for future work.
  • Paper Title Number 4
    2024
    GitHub Journal of Bugs
    This paper is about fixing template issue #693.

Presentations

  • Talk 1 on Relevant Topic in Your Field
    2012
    UC San Francisco, Department of Testing
    San Francisco, CA, USA
  • Tutorial 1 on Relevant Topic in Your Field
    2013
    UC-Berkeley Institute for Testing Science
    Berkeley, CA, USA
  • Talk 2 on Relevant Topic in Your Field
    2014
    London School of Testing
    London, UK
  • Conference Proceeding talk 3 on Relevant Topic in Your Field
    2014
    Testing Institute of America 2014 Annual Conference
    Los Angeles, CA, USA

Portfolio

  • Portfolio item number 1
    Portfolio
    Short description of portfolio item number 1

Languages

  • English
    CET-6

Interests

  • Sports
    长跑, 乒乓球, 徒步, 羽毛球