パートナー情報
税理士法人日本経営
研究者情報
罇涼稀・亀渕雅人(税理士法人日本経営)・渡邊宙(税理士法人日本経営)・松本亮(税理士法人日本経営)・東圭一(税理士法人日本経営)・岡田幸彦

この研究では,31日後のキャッシュ・フロー(CF: Cash Flow)を知るために,将来予測モデルを作る
将来のCFを事前に知ることができれば,より正確な資金・財務計画を立てることができ,資金不足といった危険な状況に対しても事前に対処することができる

図表1:仕訳データの例
4/1の仕訳は「商品を100円で販売し,代金は掛け(後払い)とした」こと,4/30の仕訳は「掛けの代金100円を現金で受け取った」こと,を意味する
複式簿記は,取引を借方と貸方の二側面から捉えることが特徴的である

図表2:仕訳のグラフ表現
「借方」列と「貸方」列に記録された各勘定科目(売上の貸方側など)をノードとする
一つの仕訳の借方側の勘定科目に該当するノードと貸方側の勘定科目に該当するノードとの間にリンクを置く
ノードの特徴量とリンクの重みとして「金額」を与える
つまり,時空間グラフを直に学習可能なモデルを利用することで,より正確な将来予測ができる可能性がある
⇒時空間グラフを入力したSTGCN v.s. 入力特徴量を変化させたLSTM(単変量,時間情報を加えた多変量,空間情報を加えた多変量,時間情報と空間情報を加えた多変量) v.s 単変量のARIMA
⇒なぜ,診療所Dの予測は壊滅的に悪いのか?もし診療所Dが特殊事例であれば,モデルの評価では診療所Dを除くことが適切と思われる
⇒診療所Dを除いた6つの診療所におけるMAPEの平均値は,STGCNが最も良い(MAPE = 8.0%)
| 診療所 | ARIMA | LSTM | STGCN |
| A | 14.7% | 6.4% | 7.6% |
| B | 2.9% | 9.7% | 5.7% |
| C | 16.4% | 9.6% | 8.5% |
| D | 33.0% | 8.9% | 450.4% |
| E | 16.0% | 11.1% | 9.6% |
| F | 12.0% | 13.7% | 12.2% |
| G | 5.2% | 3.4% | 4.1% |
| 平均 | 14.3% (11.2%) |
9.0% (9.0%) |
71.2% (8.0%) |
図表3:予測精度
LSTMは時間情報を加えたものを掲載した
「平均」行の値は7つの診療所におけるMAPEの平均値であり,括弧内の値は診療所Dを除いて計算したMAPEの平均値である
⇒この研究を実務活用する場合,提案手法が通用する条件に注意することを推奨する
この研究は,2022年より続く,税理士法人日本経営と筑波大学との共同研究シリーズの一つです。共同研究を始めた当時,私は博士前期課程1年生であり(記事執筆時は博士後期課程2年生),手に入れた仕訳データの貴重さ,面白さ,奥深さを理解していませんでした。そこから約4年をかけて,仕訳データには複式簿記特有の情報が含まれていそうなこと,良い予測モデルを作るために必要な仕訳データの前処理,そして実験のフレームワークなどを整備していき,ようやく対外的に一定の貢献が認められる研究成果を出すことができました。この過程では,共同研究先の皆様は,現場の状況,仕訳データの見方,予測タスクの設定などについて,数多くの助言をしてくださいました。この場を借りて,感謝申し上げます。
この研究は,複式簿記データサイエンスの第一歩となり得る研究ですが,論文に記載した通り,まだまだ数多くの課題が残されています。今後は,産学連携研究としての位置づけを忘れることなく,社会的にも学術的にも意義のある研究を推進したいと思います。
この研究に興味を持った方は,原著論文も併せてご確認ください。
R. Motai, M. Kamebuchi, S. Watanabe, R. Matsumoto, K. Azuma, and Y. Okada, “Cash-flow prediction model using graph neural networks and spatiotemporal information from double-entry bookkeeping data,” in 2025 IEEE International Conference on Big Data (BigData), December 2025, pp. 2431–2439.
本研究は,JSPS科研費(25KJ0671,23K22166)および筑波大学データサイエンス・エキスパート・プログラムからの助成を受けたものです。
[1] M. Zupan, “Accounting journal entries as a long-term multivariate time series: Forecasting wholesale warehouse output,” Intelligent Systems in Accounting, Finance and Management, vol. 31, no. 1, article e1551, March 2024.
[2] R. Motai, S. Mashiko, M. Kamebuchi, S. Watanabe, R. Matsumoto, and Y. Okada, “Practical experiment of predicting cash flows with LSTM and double-entry bookkeeping data,” in 2024 IEEE International Conference on Big Data (BigData), December 2024, pp. 2360–2364.
[3] M. Jin, H. Y. Koh, Q. Wen, D. Zambon, C. Alippi, G. I. Webb, I. King, and S. Pan, “A survey on graph neural networks for time series: Forecasting, classification, imputation, and anomaly detection,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 46, no. 12, pp. 10466–10485, December 2024.
[4] B. Yu, H. Yin, and Z. Zhu, “Spatio-temporal graph convolutional networks: A deep learning framework for traffic forecasting,” in Proceedings of the 27th International Joint Conference on Artificial Intelligence, July 2018, pp. 3634–3640.
[5] S. Hochreiter and J. Schmidhuber, “Long short-term memory,” Neural Computation, vol. 9, no. 8, pp. 1735–1780, November 1997.
[6] G. E. P. Box and G. M. Jenkins, Time Series Analysis: Forecasting and Control, Rev. ed. In Holden-Day series in time series analysis. San Francisco: Holden-Day, 1976.