Publications

Conference publications

[26’ICML] Kaiyuan Deng, Bo Hui, Gen Li, Jie Ji, Minghai Qin, Geng Yuan, Xiaolong Ma, “Forget-It-All: Multi-Concept Machine Unlearning via Concept-Aware Neuron Masking”, in Proceedings of The 43rd International Conference on Machine Learning (ICML, 2026).
[26’CVPR] Ci Zhang, Zhaojun Ding, Chence Yang, Jun Liu, Xiaoming Zhai, Shaoyi Huang, Beiwen Li, Xiaolong Ma, Jin Lu, Geng Yuan, “Roots Beneath the Cut: Uncovering the Risk of Concept Recovery in Pruning-Based Unlearning for Diffusion Models”, in Proceedings of The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026 (CVPR, 2026, acceptance rate: 25.42%).
[26’ICLR] Kaiyuan Deng, Gen Li, Yang Xiao, Bo Hui, Xiaolong Ma, “Forget Many, Forget Right: Scalable and Precise Concept Unlearning in Diffusion Models”, in Proceedings of the 14th International Conference on Learning Representations (ICLR, 2026, acceptance rate: 28%).
[26’ICLR] Ruimeng Ye, Zihan Wang, Zinan Ling, Yang Xiao, Manling Li, Xiaolong Ma, Bo Hui, “Your Language Model Secretly Contains Personality Subnetworks”, in Proceedings of the 14th International Conference on Learning Representations (ICLR, 2026, acceptance rate: 28%).
[25’NeurIPS] Qitao Tan, Jun Liu, Zheng Zhan, Caiwei Ding, Yanzhi Wang, Xiaolong Ma, Jaewoo Lee, Jin Lu, Geng Yuan, “Harmony in Divergence: Towards Fast, Accurate, and Memory-efficient Zeroth-order LLM Fine-tuning”, in Proceedings of the 39th Conference on Neural Information Processing Systems (NeurIPS, 2025, acceptance rate: 24.5%)
[25’NeurIPS] Hossein R. Nowdeh, Jie Ji, Xiaolong Ma, Fatemeh Afghah, “Modality-Aware SAM: Sharpness-Aware-Minimization Driven Gradient Modulation for Harmonized Multimodal Learning”, in Proceedings of the 39th Conference on Neural Information Processing Systems (NeurIPS, 2025, acceptance rate: 24.5%)
[25′ CCS] Xiaoyong Yuan, Xiaolong Ma, Linke Guo, Lan Zhang, “What Lurks Within? Concept Auditing for Shared Diffusion Models at Scale”, in Proceedings of The 32nd ACM Conference on Computer and Communications Security (CCS 2025).
[25′ EMNLP] Gaurav Bagwe, Saket Sanjeev Chaturvedi, Xiaolong Ma, Xiaoyong Yuan, Kuang-Ching Wang, Lan Emily Zhang, “Your RAG is Unfair: Exposing Fairness Vulnerabilities in Retrieval-Augmented Generation via Backdoor Attacks”, in Proceedings of the The 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP 2025, acceptance rate: 22.16%).
[25′ CIKM] Yang Xiao, Ruimeng Ye, Bohan Liu, Xiaolong Ma, Bo Hui, “Efficient Knowledge Graph Unlearning with Zeroth-order Information”, in Proceedings of the 34th Conference on Information and Knowledge Management (CIKM 2025, acceptance rate: 27.0%).
[25′ ECAI] Bohan Liu, Yang Xiao, Ruimeng Ye, Zinan Ling, Xiaolong Ma, Bo Hui, “DBA-DFL: Towards Distributed Backdoor Attacks with Network Detection in Decentralized Federated Learning”, in Proceedings of the 28th European Conference on Artificial Intelligence (ECAI-2025).
[25’ICCV] Gen Li, Yang Xiao, Jie Ji, Kaiyuan Deng, Bo Hui, Linke Guo, Xiaolong Ma, “Sculpting Memory: Multi-Concept Forgetting in Diffusion Models via Dynamic Mask and Concept-Aware Optimization”, in Proceedings of the International Conference on Computer Vision (ICCV 2025).
[25’ICCV] Yang Xiao, Wang Lu, Jie Ji, Ruimeng Ye, Gen Li, Xiaolong Ma, Bo Hui, “Optimal Transport for Brain-Image Alignment: Unveiling Redundancy and Synergy in Neural Information Processing”, in Proceedings of the International Conference on Computer Vision (ICCV 2025).
[25’Oakland] Gen Li, Chun-Chih Lin, Xiaonan Zhang, Xiaolong Ma, Linke Guo, “Adversarial Robust ViT-based Automatic Modulation Recognition in Practical Deep Learning-based Wireless Systems”, in Proceedings of the 46th IEEE Symposium on Security and Privacy (S&P 2025, acceptance rate: 14.3%).
[24’SenSys] Chenxu Jiang, Sihan Yu, Jingjing Fu, Chun-Chih Lin, Huadi Zhu, Xiaolong Ma, Ming Li, Linke Guo, “Behaviors Speak More: Achieving User Authentication Leveraging Facial Activities via mmWave Sensing”, in Proceedings of The 22nd ACM Conference on Embedded Networked Sensor Systems (SenSys 2024).
[24’ECCV] Gen Li, Zhihao Shu, Jie Ji, Minghai Qin, Fatemeh Afghah, Wei Niu, Xiaolong Ma, “Data Overfitting for On-Device Super-Resolution with Dynamic Algorithm and Compiler Co-Design”, in Proceedings of The 18th European Conference on Computer Vision (ECCV, 2024).
[24’ICML] Jie Ji, Gen Li, Lu Yin, Minghai Qin, Geng Yuan, Linke Guo, Shiwei Liu, Xiaolong Ma, “Advancing Dynamic Sparse Training by Exploring Optimization Opportunities”, in Proceedings of The 41th International Conference on Machine Learning (ICML, 2024).
[24’ICML] Lu Yin, You Wu, Zhenyu Zhang, Cheng-Yu Hsieh, Yaqing Wang, Yiling Jia, Gen Li, Ajay Jaiswal, Mykola Pechenizkiy, Yi Liang, Michael Bendersky, Zhangyang Wang, Shiwei Liu, “Outlier Weighed Layerwise Sparsity (OWL): A Missing Secret Sauce for Pruning LLMs to High Sparsity”, in Proceedings of The 41th International Conference on Machine Learning (ICML, 2024).
[24’ICLR] Gen Li, Lu Yin, Jie Ji, Wei Niu, Minghai Qin, Bin Ren, Linke Guo, Shiwei Liu, Xiaolong Ma, “NeurRev: Train Better Sparse Neural Network Practically via Neuron Revitalization”, in Proceedings of the 12th International Conference on Learning Representations (ICLR, 2024).
[24’CPAL] Haoyu Ma, Chengming Zhang, lizhi xiang, Xiaolong Ma, Geng Yuan, Wenkai Zhang, Shiwei Liu, Tianlong Chen, Dingwen Tao, Yanzhi Wang, Zhangyang Wang, Xiaohui Xie, “HRBP: Hardware-friendly Regrouping towards Block-based Pruning for Sparse CNN Training”, in Proceedings of the 1st Conference on Parsimony and Learning (CPAL, 2024)
[23’NeurIPS] Lu Yin, Gen Li, Meng Fang, Li Shen, Tianjin Huang, Zhangyang Wang, Vlado Menkovski, Xiaolong Ma, Mykola Pechenizkiy, Shiwei Liu, “Dynamic Sparsity Is Channel-Level Sparsity Learner”, in Proceedings of the 37th Conference on Neural Information Processing Systems (NeurIPS, 2023, acceptance rate: 26.1%)
[23’DATE] Sung-En Chang, Geng Yuan, Alec Lu, Mengshu Sun, Yanyu Li, Xiaolong Ma, Zhengang Li, Yanyue Xie, Minghai Qin, Xue Lin, Zhenman Fang, Yanzhi Wang, “ESRU: Extremely Low-Bit and Hardware-Efficient Stochastic Rounding Unit Design for Low-Bit DNN Training”, in Proceedings of the Design, Automation & Test in Europe Conference & Exhibition (DATE, 2023).
[23’IJCAI] Xuan Shen, Zhenglun Kong, Minghai Qin, Peiyan Dong, Geng Yuan, Xin Meng, Hao Tang, Xiaolong Ma, Yanzhi Wang, “Data Level Lottery Ticket Hypothesis for Vision Transformers”, in Proceedings of the 32nd International Joint Conference on Artificial Intelligence (IJCAI, 2023, acceptance rate: 15%).
[23’CVPR – Highlight] Gen Li, Jie Ji, Minghai Qin, Wei Niu, Bin Ren, Fatemeh Afghah, Linke Guo, Xiaolong Ma, “Towards High-Quality and Efficient Video Super-Resolution via Spatial-Temporal Data Overfitting”, in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR, 2023, top 2.5%).
[23’ICLR] Bo Hui, Da Yan, Xiaolong Ma, Wei-Shinn Ku, “Rethinking Graph Lottery Tickets: Graph Sparsity Matters”, in Proceedings of the 11th International Conference on Learning Representations (ICLR, 2023).
[23’AAAI] Zhenglun Kong, Haoyu Ma, Geng Yuan, Mengshu Sun, Yanyue Xie, Peiyan Dong, Xin Meng, Xuan Shen, Hao Tang, Minghai Qin, Tianlong Chen, Xiaolong Ma, Xiaohui Xie, Zhangyang Wang, Yanzhi Wang, “Peeling the Onion: Hierarchical Reduction of Data Redundancy for Efficient Vision Transformer Training”, will appear in Proceedings of the 37th AAAI Conference on Artificial Intelligence (AAAI 2023).
[22′ ECCV] Zhenglun Kong, Peiyan Dong, Xiaolong Ma, Xin Meng, Wei Niu, Mengshu Sun, Xuan Shen, Geng Yuan, Bin Ren, Minghai Qin, Hao Tang, Yanzhi Wang, “SPViT: Enabling Faster Vision Transformers via Soft Token Pruning”, in Proceedings of the European Conference on Computer Vision (ECCV, 2022).
[22′ ECCV] Geng Yuan, Sung-En Chang, Qing Jin, Alec Lu, Yanyu Li, Yushu Wu, Zhenglun Kong, Yanyue Xie, Peiyan Dong, Minghai Qin, Xiaolong Ma, Xulong Tang, Zhenman Fang, Yanzhi Wang, “You Already Have It: A Generator-Free Low-Precision DNN Training Framework using Stochastic Rounding”, will appear in Proceedings of the European Conference on Computer Vision (ECCV, 2022).
[22′ ICML] Tianlong Chen, Xuxi Chen, Xiaolong Ma, Yanzhi Wang, Zhangyang Wang, “Coarsening the Granularity: Towards Structurally Sparse Lottery Tickets”, in Proceedings of The Thirty-ninth International Conference on Machine Learning (ICML, 2022).
[22′ CVPR] Zejiang Hou, Minghai, Qin, Fei Sun, Xiaolong Ma, Kun Yuan, Yi Xu, Yen-Kuang Chen, Rong Jin, Yuan Xie, Sun-Yuan Kung, “CHEX: CHannel EXploration for CNN Model Compression”, in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR, 2022).
[22′ ICLR] Xiaolong Ma, Minghai Qin, Fei Sun, Zejiang Hou, Kun Yuan, Yi Xu, Yanzhi Wang, Yen-Kuang Chen, Rong Jin, Yuan Xie “Effective Model Sparsification by Scheduled Grow-and-Prune Methods”, in Proceedings of the 10th International Conference on Learning Representations (ICLR, 2022).
[22’ISQED – invited] Xiaolong Ma, Geng Yuan, Zhengang Li, Wei Niu, Yifan Gong, Tianyun Zhang, Zheng Zhan, Pu Zhao, Jian Tang, Xue Lin, Bin Ren, Yanzhi Wang, “A General Pruning Framework Enabling Real-Time Inference on Resource-Limited Mobile Devices”, will appear in Proceedings of the 23rd International Symposium on Quality Electronic Design (ISQED 2022).
[22’DATE]Siyue Wang, Geng Yuan, Xiaolong Ma, Yanyu Li, Xue Lin, Bhavya Kailkhura, “Fault-tolerant Deep Neural Networks for Processing-in-Memory Based Autonomous Edge Systems”, in Proceedings of the Design, Automation & Test in Europe Conference & Exhibition (DATE 2022).
[22′ FPGA] Mengshu Sun, Zhengang Li, Alec Lu, Yanyu Li, Sung-En Chang, Xiaolong Ma, Xue Lin, Zhenman Fang, “FILM-QNN: Efficient FPGA Acceleration of Deep Neural Networks with Intra-Layer, Mixed-Precision Quantization”, will appear in Proceedings of the International Symposium on Field-Programmable Gate Arrays (FPGA, 2022).
[21′ NeurIPS] Xiaolong Ma*, Geng Yuan*, Xuan Shen, Tianlong Chen, Xuxi Chen, Xiaohan Chen, Ning Liu, Minghai Qin, Sijia Liu, Zhangyang Wang, Yanzhi Wang, “Sanity Checks for Lottery Tickets: Does Your Winning Ticket Really Win the Jackpot?”, in Proceedings of the 35th Conference on Neural Information Processing Systems (NeurIPS, 2021).
[21′ NeurIPS – Spotlight] Geng Yuan*, Xiaolong Ma*, Wei Niu, Zhengang Li, Zhenglun Kong, Ning Liu, Yifan Gong, Zheng Zhan, Chaoyang He, Qing Jin, Siyue Wang, Minghai Qin, Bin Ren, Yanzhi Wang, Sijia Liu, Xue Lin, “MEST: Accurate and Fast Memory-Economic Sparse Training Framework on the Edge”, in Proceedings of the 35th Conference on Neural Information Processing Systems (NeurIPS, 2021).
[21′ ICML] Ning Liu, Geng Yuan, Zhengping Che, Xuan Shen, Xiaolong Ma, Qing Jin, Jian Ren, Jian Tang, Sijia Liu, Yanzhi Wang, “Lottery Ticket Preserves Weight Correlation: Is It Desirable or Not?”, in Proceedings of the 38th International Conference on Machine Learning (ICML, 2021).
[21′ IJCAI demo] Xuan Shen, Geng Yuan, Wei Niu, Xiaolong Ma, Jiexiong Guan, Zhengang Li, Bin Ren, Yanzhi Wang, “Towards Fast and Accurate Multi-Person Pose Estimation on Mobile Devices”, in Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI-21) Demonstrations Track.
[21′ ISCA] Geng Yuan, Payman Behnam, Zhengang Li, Ali Shafiei, Sheng Lin, Xiaolong Ma, Hang Liu, Xuehai Qian, Mahdi Nazm Bojnordi, Yanzhi Wang, Caiwen Ding, “FORMS: Fine-grained Polarized ReRAM-based In-situ Computation for Mixed-Signal DNN Accelerator”, in Proceedings of the 48th International Symposium on Computer Architecture (ISCA, 2021).
[21′ DAC] Tianyun Zhang, Xiaolong Ma, Zheng Zhan, Shaokai Ye, Kaidi Xu, Bingbing Li, Xiaolin Xu, Sijia Liu, Qinru Qiu, Makan Fardad, Xue Lin and Caiwen Ding, “A Unified DNN Pruning Weight Framework Using Reweighted Method”, in Proceedings of the 58th Design Automation Conference (DAC 2021).
[21′ ISQED] Geng Yuan, Zhiheng Liao, Xiaolong Ma, Yuxuan Cai, Zhenglun Kong, Xuan Shen, Jingyan Fu, Zhengang Li, Chengming Zhang, Hongwu Peng, Ning Liu, Ao Ren, Jinhui Wang, Yanzhi Wang, “Improving DNN Fault Tolerance using Weight Pruning and Differential Crossbar Mapping for ReRAM-based Edge AI”, in Proceedings of the 22th International Symposium on Quality Electronic Design (ISQED 2021).
[21’DATE] Geng Yuan, Payman Behnam, Yuxuan Cai, Ali Shafiee, Jingyan Fu, Zhiheng Liao, Zhengang Li, Xiaolong Ma, Jieren Deng, Jinhui Wang, Mahdi Bojnordi, Yanzhi Wang, Caiwen Ding, “TinyADC: Peripheral Circuit-aware Weight Pruning Framework for Mixed-signal DNN Accelerators”, in Proceedings of the Design, Automation and Test in Europe Conference (DATE 2021).
[20’GLSVLSI] Yifan Gong, Zheng Zhan, Zhengang Li, Wei Niu, Xiaolong Ma, Wenhao Wang, Bin Ren, Caiwen Ding, Xue Lin, Xiaolin Xu, Yanzhi Wang, “A Privacy-Preserving-Oriented DNN Pruning and Mobile Acceleration Framework”, in Proceedings of the 2020 on Great Lakes Symposium on VLSI (GLVLSI 2020).
[20’PACT] Masuma Akter Rumi, Xiaolong Ma, Yanzhi Wang, Peng Jiang, “Accelerating Sparse CNN Inference on GPUs with Performance-Aware Weight Pruning”, in Proceedings of the International Conference on Parallel Architectures and Compilation Techniques (PACT 2020, acceptance rate: 25%).
[20’ECCV] Xiaolong Ma, Wei Niu, Tianyun Zhang, Sijia Liu, Sheng Lin, Hongjia Li, Xiang Chen, Jian Tang, Kaisheng Ma, Bin Ren, Yanzhi Wang, “An Image Enhancing Pattern-based Sparsity for Real-time Inference on Mobile Devices”, in Proceedings of the 16th European Conference on Computer Vision (ECCV 2020, acceptance rate: 27%).
[20’ICS] Runbin Shi, Peiyan Dong, Tong Geng, Yuhao Ding, Xiaolong Ma, Martin Herbordt, Ang Li, Hayden So, and Yanzhi Wang, “CSB-RNN: A Faster-than-Realtime RNN Acceleration Framework with Compressed Structured Blocks”, in Proceeding of the International Conference on Supercomputing (ICS 2020).
[20’AAAI] Xiaolong Ma, Fuming Guo, Wei Niu, Xue Lin, Jian Tang, Kaisheng Ma, Bin Ren, Yanzhi Wang, “PCONV: The Missing but Desirable Sparsity in DNN Weight Pruning for Real-time Execution on Mobile Devices”, in Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020, acceptance rate: 20.6%).
[20’AAAI] Ning Liu, Xiaolong Ma, Zhiyuan Xu, Yanzhi Wang, Jian Tang, Jieping Ye, “AutoSlim: An Automatic DNN Structured Pruning Framework for Ultra-High Compression Rates”, in Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020, acceptance rate: 20.6%).
[20’ASPLOS] Wei Niu, Xiaolong Ma, Sheng Lin, Shihao Wang, Xuehai Qian, Xue Lin, Yanzhi Wang, Bin Ren, “PatDNN: Achieving Real-Time DNN Execution on Mobile Devices with Pattern-based Weight Pruning”, in Proceedings of the 24th ACM International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS 2020, acceptance rate: 18.07%).
[20’DAC] Zhanhong Tan, Jiebo Song, Xiaolong Ma, Sia-Huat Tan, Hongyang Chen, Shaokai Ye, Yanzhi Wang, Kaisheng Ma, “PCNN: Pattern-based Fine-Grained Regular Pruning towards Optimizing CNN Accelerators”, in Proceedings of the 57th Annual Design Automation Conference (DAC 2020).
[20’DAC] Chaoqun Chu, Yanzhi Wang, Yilong Zhao, Xiaolong Ma, Shaokai Ye, Yunyan Hong, Xiaoyao Liang, Yinhe Han, Yun Chen, Xiaosong Cui, and Li Jiang, “PIM-Prune: Fine-Grain DCNN pruning for Crossbar-based Process-In-Memory architecture”, in Proceedings of the 57th Annual Design Automation Conference (DAC 2020).
[20’ASP-DAC] Xiaolong Ma, Geng Yuan, Sheng Lin, Caiwen Ding, Fuxun Yu, Tao Liu, Wujie Wen, Xiang Chen, Yanzhi Wang, “Tiny but Accurate: A Pruned, Quantized and Optimized Framework of an Ultra Efficient DNN Device”, in 25th Asia and South Pacific Design Automation Conference (ASP-DAC, 2020).
[20’ASP-DAC] Xiaolong Ma, Zhe Li, Hongjia Li, Qiyuan An, Wenyao Xu, Qinru Qiu, Yanzhi Wang. “C3PO: Database and Benchmark for Early-stage Malicious Activity Detection in 3D Printing”, in in 25th Asia and South Pacific Design Automation Conference (ASP-DAC, 2020).
[19’ISVLSI] Ruizhe Cai, Xiaolong Ma, Olivia Chen, Ao Ren, Ning Liu, Nobuyuki Yoshikawa, Yanzhi Wang, “IDE Development, Logic Synthesis and Buffer/Splitter Insertion Framework for Adiabatic Quantum-Flux-Parametron Superconducting Circuits”, in Proceedings of the 2019 IEEE Computer Society Annual Symposium on VLSI (ISVLSI, 2019).
[19’GLSVLSI] Hongjia Li, Ning Liu, Xiaolong Ma, Sheng Lin, Shaokai Ye, Tianyun Zhang, Xue Lin, Wenyao Xu, Yanzhi Wang, “ADMM-based Weight Pruning for Real-Time Deep Learning Acceleration on Mobile Devices”, in Proceedings of the 2019 on Great Lakes Symposium on VLSI (GLSVLSI, 2019).
[19’ISLPED] Geng Yuan*, Xiaolong Ma*, Caiwen Ding, Sheng Lin, Tianyun Zhang, Zeinab S. Jalali, Yilong Zhao, Li Jiang, Sucheta Soundarajan, Yanzhi Wang, “An Ultra-Efficient Memristor-Based DNN Framework with Structured Pruning and Quantization Using ADMM”, (ISLPED, 2019).
[19’NANOARCH] Xiaolong Ma, Geng Yuan, Sheng Lin, Zhengang Li, Yanzhi Wang, “ResNet Can Be Pruned 60x: Introducing Network Purification and Unused Path Removal (P-RM) after Weight Pruning”, in 15th IEEE / ACM International Symposium on Nanoscale Architectures (NANOARCH, 2019).
[18’ASC] Olivia Chen, Xiaolong Ma, Yanzhi Wang, Naoki Takeuchi, Nobuyuki Yoshikawa, “Design and Implementation of an Extremely Energy-efficient Deep Learning Accelerator Using Superconducting Logic”, Applied Superconductivity Conference (ASC, 2018).
[18’AAAI] Yanzhi Wang, Caiwen Ding, Zhe Li, Geng Yuan, Siyu Liao, Xiaolong Ma, Bo Yuan, Xuehai Qian, Jian Tang, Qinru Qiu, Xue Lin. “Towards ultra-high performance and energy efficiency of deep learning systems: an algorithm-hardware co-optimization framework”, in AAAI Conference on Artificial Intelligence (AAAI, 2018).
[18’GLSVLSI] Caiwen Ding, Ao Ren, Geng Yuan, Xiaolong Ma, Jiayu Li, Ning Liu, Bo Yuan, Yanzhi Wang. “Structured Weight Matrices-Based Hardware Accelerators in Deep Neural Networks: FPGAs and ASICs” in Proceedings of the 2018 on Great Lakes Symposium on VLSI. (GLSVLSI, 2018).
[Best Paper Nomination][18’ISQED] Xiaolong Ma, Yipeng Zhang, Geng Yuan, Ao Ren, Zhe Li, Jie Han, Jingtong Hu, Yanzhi Wang. “An Area and Energy Efficient Design of Domain-Wall Memory-Based Deep Convolutional Neural Networks using Stochastic Computing”, in International Symposium on Quality Electronic Design (ISQED, 2018).
[17’MICRO] Caiwen Ding, Siyu Liao, Yanzhi Wang, Zhe Li, Ning Liu, Youwei Zhuo, Chao Wang, Xuehai Qian, Yu Bai, Geng Yuan, Xiaolong Ma, Yipeng Zhang, Jian Tang, Qinru Qiu, Xue Lin, Bo Yuan. “CirCNN: accelerating and compressing deep neural networks using block-circulant weight matrices”, in Proceedings of the International Symposium on Microarchitecture (MICRO, 2017).
[17’MWSCAS] Geng Yuan, Caiwen Ding, Ruizhe Cai, Xiaolong Ma, Ziyi Zhao, Ao Ren, Bo Yuan, Yanzhi Wang. “Memristor crossbar-based ultra-efficient next-generation baseband processors”, in IEEE 60th International Midwest Symposium on Circuits and Systems (MWSCAS, 2017).

Journal Publications

[TMLR] Mingyu Cao, Gen Li, Jie Ji, Jiaqi Zhang, Ajay Jaiswal, Li Shen, Xiaolong Ma, Shiwei Liu, Lu Yin, “Condense, Don’t Just Prune: Enhancing Efficiency and Performance in MoE Layer Pruning”, in Proceedings of Transactions on Machine Learning Research (TMLR).
[TAI] Gaurav Bagwe, Lan Zhang, Linke Guo, Miao Pan, Xiaolong Ma, Xiaoyong Yuan, “Is Embedding-as-a-Service Safe? Meta-Prompt-Based Backdoor Attacks for User-Specific Trigger Migration”, in Proceedings of Transactions on Artificial Intelligence (TAI).
[ISWA] Mengchen Fan, Tianyun Zhang, Xiaolong Ma, Jiacheng Guo, Zheng Zhan, Shanglin Zhou, Minghai Qin, Caiwen Ding, Baocheng Geng, Makan Fardad, Yanzhi Wang “A Unified DNN Weight Compression Framework Using Reweighted Optimization Methods”, in Proceedings of the Intelligent Systems with Applications (Impact Factor 4.3), 2025.
[TPAMI] Wei Niu, Zhengang Li, Xiaolong Ma, Peiyan Dong, Gang Zhou, Xuehai Qian, Xue Lin, Yanzhi Wang, Bin Ren, “GRIM: A General, Real-Time Deep Learning Inference Framework for Mobile Devices based on Fine-Grained Structured Weight Sparsity”, in Proceedings of the IEEE Transactions on Pattern Analysis and Machine Intelligence (Impact Factor 17.861), 2022.
[TNNLS] Xiaolong Ma, Sheng Lin, Shaokai Ye, Zhezhi He, Linfeng Zhang, Geng Yuan, Sia Huat Tan, Zhengang Li, Deliang Fan, Xuehai Qian, Xue Lin, Kaisheng Ma, Yanzhi Wang, “Non-Structured DNN Weight Pruning — Is It Beneficial in Any Platform?”, in Proceedings of the IEEE Transactions on Neural Networks and Learning Systems (Impact Factor 8.793), 2022.
[TNNLS] Tianyun Zhang, Shaokai Ye, Kaiqi Zhang, Xiaolong Ma, Ning Liu, Linfeng Zhang, Jian Tang, Kaisheng Ma, Xue Lin, Makan Fardad, Yanzhi Wang, “StructADMM: A Systematic, High-Efficiency Framework of Structured Weight Pruning for DNNs”, in Proceedings of the IEEE Transactions on Neural Networks and Learning Systems (Impact Factor 8.793), 2020.
[Contributed Article][CACM] Shaoshan Liu, Xiaolong Ma, Wei Niu, Bin Ren, Xipeng Shen, Yanzhi Wang, Pu Zhao, “CoCoPIE: Making Mobile AI Sweet As PIE — Compression-Compilation Co-Design Goes a Long Way” in the Communications of the ACM, 2021. (authors in alphabetical order, Impact Factor 14.06)

Workshop publications

[Oral][25′ RegML@NeurIPS] Yang Xiao, Gen Li, Jie Ji, Ruimeng Ye, Xiaolong Ma, Bo Hui, “The Right to be Forgotten in Pruning: Unveil Machine Unlearning on Sparse Models”, in NeurIPS 2025 Workshop on Regulatable ML.
[25′ CFAgentic@ICML] Bohan Liu, Yang Xiao, Ruimeng Ye, Zinan Ling, Xiaolong Ma, Bo Hui, “DBA-DFL: Towards Distributed Backdoor Attacks with Network Detection in Decentralized Federated Learning”, in ICML 2025 Workshop on Collaborative and Federated Agentic Workflows.
[Spotlight Paper][23’ICLR SNN] Lu Yin, Gen Li, Meng Fang, Li Shen, Tianjin Huang, Zhangyang Wang, Vlado Menkovski, Xiaolong Ma, Mykola Pechenizkiy, Shiwei Liu “Dynamic Sparsity Is Channel-Level Sparsity Learner”, (ICLR 2023 Sparsity in Neural Networks workshop).
[Spotlight Paper][22’CVPR T4V] Zhenglun Kong, Peiyan Dong, Xiaolong Ma, Xin Meng, Wei Niu, Mengshu Sun, Xuan Shen, Geng Yuan, Bin Ren, Minghai Qin, Hao Tang, Yanzhi Wang, “Enabling Faster Vision Transformers via Soft Token Pruning”, in Transformers for Vision (T4V) at CVPR, 2022.
[22′ WWW workshop] Bingyao Li, Qi Xue, Geng Yuan, Sheng Li, Xiaolong Ma, Yanzhi Wang, and Xulong Tang, “Optimizing Data Layout for Training Deep Neural Networks”, The ACM Web Conference Workshop of the International World Wide Web Conference (WWW), 2022.
[22’HAET] Sung-En Chang, Geng Yuan, Alec Lu, Mengshu Sun, Yanyu Li, Xiaolong Ma, Yanyue Xie, Minghai Qin, Xue Lin, Zhenman Fang, and Yanzhi Wang. “Low-bit DNN Training with Hardware-Efficient Stochastic Rounding Unit Design”, in Hardware Aware Efficient Training (HAET) Workshop at ICML, 2022.
[22’HAET] Geng Yuan, Sung-En Chang, Alec Lu, Jun Liu, Qing Jin, Yanyu Li, Yushu Wu, Zhenglun Kong, Yanyue Xie, Peiyan Dong, Minghai Qin, Xiaolong Ma, Zhenman Fang, Yanzhi Wang, “Get the Random Number on the fly: A Low-Precision DNN Training Framework using Stochastic Rounding without the Random Number Generator”, in Hardware Aware Efficient Training (HAET) Workshop at ICML, 2022.
[Best Paper Award][21’HAET] Xiaolong Ma, Zhengang Li, Geng Yuan, Wei Niu, Bin Ren, Yanzhi Wang, Xue Lin, “Memory-Bounded Sparse Training on the Edge”, (ICLR 2021 workshop of Hardware-Aware Efficient Training of Deep Learning Models).
[20’BARC] Xiaolong Ma, Wei Niu, Bin Ren, Yanzhi Wang, “A Desirable Sparsity Dimension for Real-time Acceleration”, Boston Area Architecture Workshop BARC, 2020).
[19’ODML-CDNNR] Sheng Lin, Xiaolong Ma, Geng Yuan, Shaokai Ye, Kaisheng Ma, Yanzhi Wang, “Toward Extremely Low Bit and Lossless Accuracy in DNNs with Progressive ADMM”, Workshop on On-Device Machine Learning & Compact Deep Neural Network Representations (ICML workshop, 2019).
[19’ODML-CDNNR] Wei Niu, Xiaolong Ma, Yanzhi Wang, Bin Ren, “26ms Inference Time for ResNet-50: Towards Real-Time Execution of all DNNs on Smartphone”, Workshop on On-Device Machine Learning & Compact Deep Neural Network Representations (ICML workshop, 2019).