头像

徐辰

  • 个人资料
    • 部门: 数据科学与工程学院
    • 性别:
    • 专业技术职务: 教授/博士生导师
    • 毕业院校: 华东师范大学
    • 学位: 博士
    • 学历: 研究生
    • 联系电话: 021-62231592
    • 电子邮箱: cxu@dase.ecnu.edu.cn
    • 办公地址: 中北校区地理馆109
    • 通讯地址: 上海市中山北路3663号华东师范大学数据科学与工程学院
    • 邮编: 200062
    • 传真:

    工作经历

    2023年--至今 华东师范大学 数据科学与工程学院 教授(破格晋升)

    2018年--2022年 华东师范大学 数据科学与工程学院 副教授

    2014年--2018年 德国柏林工业大学 数据库与信息系统管理研究组 高级研究助理/博士后(合作导师:Prof. Dr. Volker Markl

    教育经历

    2009年--2014年 华东师范大学 计算机应用技术 博士(导师:周傲英教授

    2011年04月--07月 澳大利亚昆士兰大学 数据与知识工程实验室 访问实习生(合作导师:周晓方教授

    2005年--2009年 合肥工业大学 计算机科学与技术 本科

    个人简介

    徐辰,华东师范大学数据科学与工程学院教授,博士生导师。2014年-2018年担任德国柏林工业大学高级研究助理,受柏林大数据中心(BBDC)项目资助从事博士后研究,参与开源系统Apache Flink的研发,该系统目前在工业界和学术界均得到广泛关注。2009年获合肥工业大学计算机科学与技术学士学位,2014年获华东师范大学计算机应用技术博士学位,期间曾于2011年4月-7月赴澳大利亚昆士兰大学短期访问。主要研究兴趣是大规模分布式数据管理技术、分布式计算系统、当代数据管理系统等,相关研究成果发表在ICDE、VLDB、SIGMOD等会议和TKDE期刊。

    社会兼职

    程序委员会委员(PC Member)

    VLDB 2021 (PhD Workshop)

    SIGMOD 2020 (Demo Track)

    ICPADS 2018


    期刊审稿人(Reviewer)

    IEEE TKDE

    VLDB Journal

    软件学报

    Journal of Computer Science and Technology

    Frontiers of Computer Science

    Distributed and Parallel Databases

    研究方向

    数据管理与智能计算系统DMIC(Data Management and Intelligence Computing System)研究室的研究方向包括:分布式计算系统、当代数据管理系统、大规模分布式数据管理技术等,涉及大数据处理系统、数据库系统、深度学习系统等,研究工作得到国家和上海市科技计划,以及阿里、腾讯等合作企业的支持。目前正在开展的研究工作:

    1. 深度学习系统

    深度学习系统的训练性能优化:机器学习、人工智能是热门的名词,不少研究关注于准确率的因素。我们有所不同,着眼于如何提高训练算法的运算速度。面向深度学习训练负载,我们的研究包括如何从算法特性、硬件架构等方面加速算法执行,分别在数据并行和流水并行的训练方式下开展性能优化工作,从事相关研究的同学入选了腾讯犀牛鸟精英人才计划。

    深度学习系统的推理性能优化:面向深度学习推理负载,我们研究如何降低推理的延迟、提高吞吐量。我们还关注如何与流计算系统等大数据处理系统之间进行融合,从而高效地执行深度学习推理。我们正在与腾讯公司合作研究深度学习推理系统的性能优化技术。

    2. 新型数据库系统

    融合大数据处理与数据库系统的查询处理引擎:数据库系统提供SQL作为编程接口,便于用户操作数据库。大数据处理系统提供的编程接口不仅包括SQL,还有类SQL、甚至高级语言,增加了编程的灵活性,这在表达复杂数据分析等场景当中具有优势。因此,如何使得数据库系统能够支持这种类型的查询是我们感兴趣的话题。我们正在与OceanBase合作研发融合大数据处理和数据库系统的查询处理引擎。

    面向CPU-GPU异构体系结构的新型数据库系统:当前的处理器体系结构正在发生变化,GPU已从专用图形图像处理器逐步发展成为加速数据处理的通用处理器。然而,传统数据库系统在软件层面的设计主要考虑的是面向CPU的底层体系结构。如何利用CPU-GPU异构体系架构加速OLAP查询分析,是我们感兴趣的研究方向。我们正在研制面向CPU-GPU异构体系架构的SQL查询编译及优化器。

    3. 大数据处理系统

    基于大数据平台的机器学习系统:大数据处理平台在机器学习等场景中广泛应用,基于Spark等大数据处理平台构建分布式机器学习系统是基本共识。机器学习算法通常可以表达为一系列的矩阵运算,这些运算可以翻译执行计划并进行优化。我们结合机器学习算法的特点,设计了针对迭代式矩阵运算的混合计算、冗余消解技术,相关研究成果连续发表在数据管理领域最顶级的学术会议SIGMOD 2021、SIGMOD 2022,研制的机器学习系统性能与现有系统相比得到显著提升。

    高可用的分布式图处理系统:图数据广泛存在于社交网络、搜索引擎、位置服务等应用中,我们通常采用大规模分布式图处理系统(例如,Giraph等)来进行基于图的计算分析。Giraph等图处理系统中的计算过程通常是一个迭代过程,这一过程不断地更新图中顶点的状态,直到该状态满足收敛条件。由于迭代过程往往耗时较长,在系统运行过程中很可能出现因网络拥塞或节点硬件故障等系统中某些节点宕机的现象,因此如何有效支持容错是值得研究的重要问题。我们研制了具有高可用特性的分布式图处理系统,在ICDE 2016、TKDE 2017、VLDB 2018等数据库领域的顶级学术会议和期刊发表了相关研究成果。



    实验室常年招收硕士、博士研究生等,欢迎对我的研究方向感兴趣,有志于攻读硕士、博士学位的同学或希望参与科创训练的本科生将简历、成绩单等材料发送给我或和实验室在读同学联系!


    对未来学生的期望:

    1. 学习态度:对待科研或实践工作有端正的学习态度,态度决定一切;

    2. 逻辑思维:学习知识时不是死记硬背,而是能够反复问为什么,有归纳、整理知识的好习惯,了解逻辑演绎和推理的科学思维,推荐阅读《几何原本》;

    3. 编程基础:扎实的C++/JAVA等编程基础,具有编程的sense,即利用计算机程序解决问题的能力;

    4. 理论基础:理解操作系统工作原理,了解数据库系统实现的原理,推荐阅读《现代操作系统:原理与实现》和《数据库系统实现》;

    5. 兴趣志向:对数据管理系统内核技术感兴趣,而不仅限于使用SQL或其它API,有志于从事底层系统的研发,有应对困难与挑战的勇气与信心;对新知识、新技术充满好奇心,善于主动学习,例如《数据密集型应用系统设计》和《智能计算系统》,以及我编写的《分布式计算系统》。


    经过3-5年实验室学习后的愿景:

    1. 具有严谨的逻辑思维能力,掌握自我学习的方法论(这是无论将来是否以科学研究作为职业都需具备的能力);

    2. 具有扎实的数据管理系统设计与实现的理论基础,能够熟练阅读英文论文、准确理解并综述前沿技术;

    3. 吃透若干开源系统的源码,具备修改源码或依据基础理论开发原型系统的能力,能够胜任大型软件系统的研发工作;

    4. 博士生有高水平论文(CCF-B类及以上)的发表和良好的presentation技能,以及带领小团队的经验;

    5. 到大型企业或海外高水平实验室工作,从事数据管理系统内核相关的研究与开发。


    指导及协助指导的研究生

    丁光耀(直博) 潘青峰(硕博连读) 张晨阳(硕博连读)

    牛悦安(学硕) 徐志榛(学硕) 刘明熹(学硕) 卢林军(学硕)  

    孙玉书(专硕) 彭俊雄(专硕)  许珈赫(专硕) 杨新宇(专硕) 支家和(专硕)


    学生获奖

    陈梓浩:2022年腾讯犀牛鸟精英人才计划、研究生国家奖学金、2023年ACM SIGMOD优博奖2022-2023学年华东师范大学研究生优秀学位论文奖(博士)

    杨振华:2022-2023学年华东师范大学研究生优秀学位论文奖(硕士)

    陈启航:APWeb-WAIM 2020最佳系统演示奖

    刘明熹:2023全国大学生计算机系统能力大赛-数据库管理系统设计赛一等奖

    潘青峰:2023年中国数据库学院暑期学校优秀学员一等奖


    毕业生去向

    华为 2人

    阿里 1人

    快手 2人

    携程 1人

    拓数派 2人

    达梦 1人

    杭州中学 1人

    招生与培养

    开授课程

    欢迎访问我的课程主页授课采用我编写的《分布式计算系统》教材,由高等教育出版社出版,欢迎通过京东当当微店天猫等平台选购!


    课程荣誉:

    上海高校市级一流本科课程(2023)

    上海高校市级重点课程(2023)

    华东师范大学第十四届青年教师教学比赛二等奖(2022)

    华东师范大学精品教材建设专项基金(2020-2022)


    本科生课程:

    2023年起 《分布式计算系统》

    2021年-2022年 《分布式编程模型与系统》

    2018年-2019年 《分布式模型与编程》


    研究生课程:

    2020年-至今 《大规模数据处理系统》

    2021年-2022年 《分布式计算系统》

    2019年 《大数据处理系统》

    2018年-2019年 《高级数据库系统》

    科研项目

    中央军委科技委项目 *** 2023-2025 (项目负责人)

    国家自然科学基金面上项目 支持流水并行的深度学习系统性能优化 2023-2026 (项目负责人)

    上海市自然科学基金面上项目 融合机器学习负载的数据库查询处理 2023-2026 (项目负责人)

    CCF-腾讯犀牛鸟科研基金 基于模型并行的推理技术与系统 2021-2022 (项目负责人)

    国家自然科学基金青年项目 面向分布式迭代数据处理的高效容错机制 2020-2022 (项目负责人)

    国防科技重点实验室基金 *** 2020-2021 (项目负责人)

    上海市扬帆计划 支持分布式图计算系统故障处理的混合恢复机制 2019-2022 (项目负责人)

    国家重点研发计划 新型区块链体系架构设计理论与方法 2021-2024 (主要参与人)

    国家重点研发计划 面向异构体系结构的高性能分布式数据处理技术与系统 2018-2021 (学术骨干)

    华东师范大学科研创新基金 异构数据处理平台中DNN推理的模型共享与故障恢复 2020 (项目负责人)



    学术成果

    论文论著

    Chenyang Zhang, Junxiong Peng, Chen Xu*, Quanqing Xu, Chuanhui Yang. IMBridge: Impedance Mismatch Mitigation between Database Engine and Prediction Query Execution. SIGMOD 2024. (CCF A)

    Guangyao Ding, Chen Xu*, Weining Qian. Hybrid Evaluation for Occlusion-based Explanations on CNN Inference Queries. ICDE 2024. (CCF A)

    潘青峰, 徐辰*. 基于查询编译的SQL执行技术研究进展. 计算机研究与发展 2024. (CCF 中文T1)

    丁光耀, 徐辰*,  钱卫宁, 周傲英. 支持深度学习的视觉数据库管理系统研究进展. 软件学报 35(3), 2024. (CCF 中文T1)

    徐志榛, 徐辰*, 丁光耀, 陈梓浩, 周傲英. 支持实时流计算应用的关键技术研究进展. 软件学报 35(1), 2024. (CCF 中文T1)

    Zihao Chen,  Chen Xu*, Weining Qian, Aoying Zhou. Elastic Averaging for Efficient Pipelined DNN Training. PPoPP 2023. (CCF A)

    Zhenhua Yang, Qingfeng Pan, Chen Xu*Fine-grained Tuple Transfer for Pipelined Query Execution on CPU-GPU Coprocessor. DASFAA 2023. (CCF B)

    Yuean Niu, Zhizhen Xu, Chen Xu*, Jiaqiang Wang. Accelerating Recommendation Inference via GPU Streams. DASFAA 2023. (CCF B)

    陈梓浩, 徐辰*, 钱卫宁, 周傲英. 面向大数据分析的分布式矩阵计算系统研究进展. 软件学报 34(3), 2023. (CCF 中文T1)

    Chen Xu, Yi Yang, Qingfeng Pan, Hongfu Zhou. ACF2: Accelerating Checkpoint-Free Failure Recovery for Distributed Graph Processing. APWeb-WAIM 2022. (CCF C)

    Zhenhua Yang, Yi Yang, Chen Xu*.  Demonstration on Unblocking Checkpoint for Fault-tolerance in Pregel-like Systems. APWeb-WAIM 2022. (CCF C)

    Zihao Chen, Baokun Han, Chen Xu*, Weining Qian, Aoying Zhou. Redundancy Elimination in Distributed Matrix Computation. SIGMOD 2022. (CCF A)

    Zihao Chen, Zhizhen Xu, Baokun Han, Chen Xu*, Weining Qian, Aoying Zhou. ReMac: A Matrix Computation System with Redundancy Elimination. VLDB 2022. (CCF A)

    孟令睿,丁光耀, 徐辰*, 钱卫宁, 周傲英. 基于深度学习的新型视频分析系统综述. 软件学报 33(10), 2022. (CCF 中文T1)

    Baokun Han, Zihao Chen, Chen Xu*, Aoying Zhou. Efficient Matrix Computation for SGD-based Algorithms on Apache Spark. DASFAA 2022. (CCF B)

    Yi Yang, Zhenhua Yang,  Chen Xu* .  Exploiting Unblocking Checkpoint for Fault-tolerance in Pregel-like Systems. WISE 2021. (CCF C)

    Nifei Bi, Xiansen Chen, Chen Xu*, Aoying Zhou. Beamer: An End-to-End Deep Learning Framework for Unifying Data Cleaning in DNN Model Training and Inference. CIKM 2021. (CCF B)

    Yi Yang, Chen Xu*, Chao Kong, Aoying Zhou. Hybrid Checkpointing for Iterative Processing in BSP-Based Systems. WISA 2021. (第十八届CCF中国信息系统及应用大会)

    Zihao Chen, Zhizhen Xu, Chen Xu*, Juan Soto, Volker Markl, Weining Qian, Aoying Zhou. HyMAC: A Hybrid Matrix Computation System. VLDB 2021. (CCF A)

    Zihao Chen, Chen Xu*, Juan Soto, Volker Markl, Weining Qian, Aoying Zhou. Hybrid Evaluation for Distributed Iterative Matrix Computation. SIGMOD 2021. (CCF A)

    Zhizhen Xu, Zihao Chen,  Chen Xu* . Loupe: A Visualization Tool for High-level Execution Plans in SystemDS. DASFAA 2021. (CCF B)

    Qihang Chen, Guangyao Ding, Chen Xu*, Weining Qian, Aoying Zhou. Euge: Effective Utilization of GPU Resources for Serving DNN-based Video Analysis. APWeb-WAIM 2020. (CCF CBest Demo Paper Award)

    窦勇, 王嘉伦, 苏华友, 徐辰, 宫晓利, 阳王东, 翁楚良, 李战怀, 李肯立, 于戈, 周傲英. 从计算机体系结构发展历程看数据流计算思想. 中国科学: 信息科学 2020. (CCF 中文T1)

    毕倪飞, 丁光耀,  陈启航, 徐辰*, 周傲英. 数据流计算模型及其在大数据处理中的应用. 大数据 2020. (CCF 中文T2)

    Chen Xu, Rudi Poepsel Lemaitre, Juan Soto, Volker Markl. Fault-Tolerance for Distributed Iterative Dataflows in Action. PVLDBvol 11, no. 12, 2018. (CCF A)

    Chen Xu, Markus Holzemer, Manohar Kaul, Juan Soto, Volker Markl. On Fault Tolerance for Distributed Iterative Dataflow Processing. IEEE Transactions on Knowledge and Data Engineering (TKDE)vol 29, no. 8, 2017. (CCF A)

    Chen Xu, Markus Holzemer, Manohar Kaul, Volker Markl. Efficient Fault-tolerance for Iterative Graph Processing on Distributed Dataflow Systems. ICDE 2016. (CCF A)

    Chao Kong, Ming Gao, Chen Xu, Weining Qian, Aoying Zhou. Entity Matching Across Multiple Heterogeneous Data Sources. DASFAA 2016. (CCF B)

    Sergey Dudoladov, Chen Xu, Sebastian Schelter, Asterios Katsifodimos, Stephan Ewen, Kostas Tzoumas, Volker Markl. Optimistic Recovery for Iterative Dataflows in Action. SIGMOD 2015. (CCF A)

    Chen Xu, Aoying Zhou. Quality-aware Scheduling for Key-value Data Stores. Springer Briefs in Computer Science 2015. (学术专著)

    Chen Xu, Fan Xia, Mohamed A. Sharaf, Minqi Zhou, Aoying Zhou. AQUAS: A Quality-Aware Scheduler for NoSQL Data Stores. ICDE 2014. (CCF A)

    Chen Xu, Mohamed A. Sharaf, Xiaofang Zhou, Aoying Zhou. Quality-Aware Schedulers for Weak Consistency Key-value Data Stores. Distributed and Parallel Databases (DAPD)vol 32, no. 4, 2014. (CCF C)

    Chen Xu, Mohamed A. Sharaf, Minqi Zhou, Aoying Zhou, Xiaofang Zhou. Adaptive Query Scheduling in Key-Value Data Stores. DASFAA 2013. (CCF B)

    Chen Xu, Minqi Zhou, Feng Chen, Aoying Zhou. Detecting User Preference on Microblog. DASFAA 2013. (CCF B)

    荣誉及奖励

    2022年国家级教学成果二等奖

    2022年上海市优秀教学成果一等奖

    2022年华东师范大学第十四届青年教师教学比赛二等奖

    2021年华东师范大学教学成果特等奖 

    2020年APWeb-WAIM国际会议最佳演示系统论文奖

    2020年上海市科技进步一等奖

    2019年上海市青年科技英才扬帆计划