大規模な高精度量子化学計算の高速化に関する当共同研究講座の研究成果が学術論文誌や国際会議に採択され、2025年12月に広島大学HPに研究成果記事が掲載されました。
https://www.hiroshima-u.ac.jp/news/94372
概要
今回の研究成果では、大規模な量子化学計算を可能にする計算量削減手法をGPU実装し、既存の量子化学ソフトウェアに対して10倍以上の高速化を実現しました。これにより、当共同研究講座が公開しているOSS「GANSU」では、100原子を超える分子系のハートリーフォック法やポストハートリーフォック法が数秒から数十秒で実行可能となりました。さらに、フラグメント分割手法を用いたポストハートリーフォック法のマルチGPU実装により、従来は二カ月以上かかっていた300原子以上のCCSD計算を1.4時間で達成しました。
本研究成果記事では、下記の代表的な3つの計算量削減手法について紹介しています。
1. Direct-SCFアルゴリズム
2. 密度フィッティング(RI近似)
3. フラグメント分割手法
背景
新しい医薬品や高機能な材料を開発するプロセスでは、無数の候補化合物についてその性質を調べて最適なものを見つけ出す必要があります。この探索を、量子力学の理論に基づいた電子レベルのコンピュータ・シミュレーションを用いて高精度に実現できる量子化学計算は、実験にかかる膨大な時間とコストを削減できるためその実用化が大きく期待されています。しかし量子化学には、対象とする原子数など化合物のサイズが大きくなるほど、計算に必要な時間とメモリ量が爆発的に増加するという計算量の壁が存在します。この壁を打破するために、量子化学の中心的なフレームワークであるハートリーフォック法やポストハートリーフォック法では、様々な計算量削減手法が開発されています。
一方でそれらの手法を、専門性が異なる情報・計算機科学の知見を持って最新のコンピュータ・アーキテクチャに向けて効率的に実装するためには技術的な課題が残されています。こうした背景も一因となり、これまで量子化学計算は扱える化合物サイズの限界や計算コストの問題が解決できず、創薬や材料開発における実用化が制限されてきました。
Direct-SCFアルゴリズム
ハートリーフォック法は、原子数のおよそ4乗に比例する組み合わせの電子に関する積分計算(二電子積分)とその値をメモリに保存するためのデータ使用量が大きなボトルネックとなっています。そのため100原子を超える規模では、これらの積分値がCPUやGPUのメモリ容量に収まりきらないため計算が困難になります。そこで本研究では、二電子積分を保存せず必要なときにオンザフライ計算することでメモリ使用量を原子数のおよそ2乗に削減できる「Direct-SCFアルゴリズム」に注目し、GPUを用いて並列化および高速化をしました。膨大な積分値を効率的に集約する並列アルゴリズムを提案することで、300原子以上の分子についても高速なハートリーフォック法の実行を可能にしました。今回の研究成果によって、既存の量子化学ソフトウェアに対して最大13.1倍の高速化を実現しました。

密度フィッティング(RI近似)
また、二電子積分を近似して求めることで必要なメモリ量を原子数の4乗からおよそ3乗に削減できる「密度フィッティング(RI近似)」と呼ばれる高精度な近似手法についても、GPU実装および高速化を実施しました。これはハートリーフォック法だけでなくポストハートリーフォック法においても有効な近似計算手法であり、より高精度な大規模量子化学計算を実現することができます。GANSUでは密度フィッティングを用いてポストハートリーフォック法のひとつであるメラープレセット法が実装され、およそ200原子規模の分子において既存の量子化学ソフトウェアに対して最大12.7倍の高速化を達成しました。

フラグメント分割手法
しかし創薬や材料開発で取り扱われるより大きな規模の化合物について高精度なポストハートリーフォック法を実現するためには、原子数の5乗や6乗といったさらに爆発的に増加する計算量の壁を打破する必要があります。これを解決するアプローチとして、大規模な化合物をフラグメントと呼ばれる小さな部分系に分割することで計算量を大幅に削減する「フラグメント分割手法」の高速化に取り組んでいます。当共同研究講座では、フラグメント分割手法のひとつであるDMET (Density Matrix Embedding Theory) というアルゴリズムを高速化しました。分割された各フラグメントに対してひとつのGPUを割り当て、さらにマルチGPUによって複数フラグメントの計算を並列に実行することで高速なポストハートリーフォック法を実現しています。またこの手法は、化合物を分割して計算することによる近似誤差が発生するため、この精度誤差を最小化する分割方法が極めて重要です。そこで富士通株式会社より研究開発されている自動分割手法を活用し、計算精度を維持できるようにフラグメントを作成しています。GPUクラスタを用いた今回の大規模実行では、創薬の分野で対象となるタンパク質と薬剤候補化合物の結合部分に含まれる372原子について、DMETを用いた結合クラスタ法(CCSD)を1.4時間で完了しました。これにより従来のCCSD計算にかかる見積もり1,813時間に対して1,295倍の高速化を達成しました。

今後の展開
これらの計算量削減手法をオープンソースの量子化学ソフトウェアGANSUに実装および順次公開することで、大規模な量子化学計算が一般に利用可能となります。今後は1,000原子などさらに大規模かつ高速なポストハートリーフォック法の実現に向けてスーパーコンピュータを活用した分散並列実装などを目指します。
関連論文
- Satoki Tsuji, Yasuaki Ito, Haruto Fujii, Nobuya Yokogawa, Kanta Suzuki, Koji Nakano, Victor Parque, and Akihiko Kasagi, “GPU-Accelerated Fock Matrix Computation with Efficient Reduction,” Applied Sciences, vol. 15, no. 9, 4779, April 2025. (DOI)
- Satoki Tsuji, Yasuaki Ito, Haruto Fujii, Nobuya Yokogawa, Kanta Suzuki, Koji Nakano and Akihiko Kasagi, “Dynamic Screening of Two-Electron Repulsion Integrals in GPU Parallelization,” in Proc. of International Symposium on Computing and Networking Workshops (CANDARW), pp. 211-217, Naha, Okinawa, November 2024. (DOI, Best Paper Award)
- Kanta Suzuki, Yasuaki Ito, Haruto Fujii, Nobuya Yokogawa, Satoki Tsuji, Koji Nakano, Victor Parque, and Akihiko Kasagi, “Efficient GPU Implementations of Three-Center Two-Electron Repulsion Integrals,” Concurrency and Computation: Practice and Experience, vol. 37, no. 25-26, e70328, 2025. (DOI)
- Kanta Suzuki, Yasuaki Ito, Nobuya Yokogawa, Satoki Tsuji, Koji Nakano, Victor Parque and Akihiko Kasagi, “GPU Acceleration of RI-RMP2 Correlation Energy Computation,” in Proc. of International Symposium on Computing and Networking, pp. 174-180, Yamagata, Yamagata, November 2025. (DOI)
- Satoshi Imamura, Akihiko Kasagi, and Eiji Yoshida, “Accurate and Fast Geometry Optimization with Time Estimation and Method Switching,” arXiv preprint arXiv:2404.12842, 2024.