複式簿記データはキャッシュ・フローの将来予測に資するのか？

診療所の仕訳帳を用いたデータサイエンス

サービスネットワーク医療計画データを可視化するモデリングする予測するデータサイエンスの手法を開発したいより良い改善策を提案したい

2026 03.16 08:00

パートナー情報

税理士法人日本経営

研究者情報

罇涼稀・亀渕雅人（税理士法人日本経営）・渡邊宙（税理士法人日本経営）・松本亮（税理士法人日本経営）・東圭一（税理士法人日本経営）・岡田幸彦

取り組みの概要
背景と課題
提案手法
実験設定
成果と提案
後記
参考文献

取り組みの概要

背景と課題

複式簿記データサイエンスへの期待

経営組織は複式簿記に基づく仕訳データを持っているが，その特徴を十分に活用できていない
仕訳データから新しくそして役に立つ情報を手に入れることができれば，より優れた経営判断ができる
しかし，仕訳データをどのように分析すれば，そのような役に立つ情報を得られるかは，研究されてこなかった

研究の問い

仕訳データのどのような特徴に注目して分析すれば良いか？
仕訳データの特徴をどのように活かして経営に役に立つ情報を作れば良いか？

この研究では，31日後のキャッシュ・フロー（CF: Cash Flow）を知るために，将来予測モデルを作る
将来のCFを事前に知ることができれば，より正確な資金・財務計画を立てることができ，資金不足といった危険な状況に対しても事前に対処することができる

提案手法

使用データ

共同研究先経由で個別に了承を得て受け取った，日本の7つの診療所の仕訳データ

図表1：仕訳データの例

4/1の仕訳は「商品を100円で販売し，代金は掛け（後払い）とした」こと，4/30の仕訳は「掛けの代金100円を現金で受け取った」こと，を意味する
複式簿記は，取引を借方と貸方の二側面から捉えることが特徴的である

前処理

仕訳データをグラフ（点と線，ノードとリンク）で表す
一日分の仕訳を一つのグラフとして，グラフの時系列を作る

図表2：仕訳のグラフ表現

「借方」列と「貸方」列に記録された各勘定科目（売上の貸方側など）をノードとする
一つの仕訳の借方側の勘定科目に該当するノードと貸方側の勘定科目に該当するノードとの間にリンクを置く
ノードの特徴量とリンクの重みとして「金額」を与える

モデルの学習を安定させるため，金額（ノードの特徴量，リンクの重み）は，対数変換した後に正規化する

時空間グラフニューラルネットワーク

先行研究では，複式簿記データの金額の時間変化[1]と，借方と貸方の関係[2]が，将来予測に役立つ可能性が示された
これらを時空間グラフ（グラフの時系列）から捉えなおすと，金額の時間変化はノードの特徴量の時系列（時間情報），借方と貸方の関係はリンク（空間情報），として解釈できる

つまり，時空間グラフを直に学習可能なモデルを利用することで，より正確な将来予測ができる可能性がある

今回の研究では，時空間グラフを扱うことができる，時空間グラフニューラルネットワーク（STGNN: Spatio-Temporal Graph Neural Network）[3]を使う

実験設定

予測対象

共同研究先との打ち合わせから，31日後のCFに設定

特徴量

仕訳データから作成した時空間グラフ（時空間情報）
仕訳データから作成した日次の合計残高試算表（時間情報）
仕訳データのグラフ表現の埋め込み（空間情報）

モデル

時空間情報を扱うことができるSpatio-Temporal Graph Convolution Network (STGCN) [4]（STGNNの一種）
先行研究で優れた予測精度を発揮したLSTM [5]（リカレントニューラルネットワーク（RNN）の一種）
実務的によく使われるARIMA [6]

⇒時空間グラフを入力したSTGCN v.s. 入力特徴量を変化させたLSTM（単変量，時間情報を加えた多変量，空間情報を加えた多変量，時間情報と空間情報を加えた多変量） v.s 単変量のARIMA

学習と評価

7つの診療所ごとにモデルを作り，評価する
最新365日分のデータを性能評価用（テストデータ），残りのデータの中で新しい365日分をハイパーパラメータのチューニング用（検証データ），残りをモデルの学習用（学習データ）とする
テストデータにおける誤差（MAPE：平均絶対パーセント誤差）が小さいほど良い

成果と提案

STGCN v.s LSTM v.s ARIMA

今回使用した7つの診療所において，平均的に最も良いモデルはLSTM（MAPE = 9.0%），2番目に良いモデルはARIMA（MAPE = 14.3%），最も悪いモデルはSTGCN（MAPE = 71.2%）だった
STGCNのMAPEの平均値は，診療所Dの非常に大きな予測誤差の影響を受けている

⇒なぜ，診療所Dの予測は壊滅的に悪いのか？もし診療所Dが特殊事例であれば，モデルの評価では診療所Dを除くことが適切と思われる
⇒診療所Ｄを除いた6つの診療所におけるMAPEの平均値は，STGCNが最も良い（MAPE = 8.0%）

診療所	ARIMA	LSTM	STGCN
A	14.7%	6.4%	7.6%
B	2.9%	9.7%	5.7%
C	16.4%	9.6%	8.5%
D	33.0%	8.9%	450.4%
E	16.0%	11.1%	9.6%
F	12.0%	13.7%	12.2%
G	5.2%	3.4%	4.1%
平均	14.3% (11.2%)	9.0% (9.0%)	71.2% (8.0%)

図表3：予測精度

LSTMは時間情報を加えたものを掲載した
「平均」行の値は7つの診療所におけるMAPEの平均値であり，括弧内の値は診療所Dを除いて計算したMAPEの平均値である

追加分析

診療所Dの資金管理実務を調査したところ，一部特殊な資金管理を行っていた
取引の一部を個人が立て替え払いすることが，仕訳とCFを関連付けるSTGCNの学習を妨げた可能性がある

提案

毎日の取引を仕訳データとして記録しておくことで，CFといった財務変数を精度良く予測できる可能性がある
診療所Dの事例のように，時空間グラフ自体に十分な情報が含まれていない場合，予測が失敗するおそれがある

⇒この研究を実務活用する場合，提案手法が通用する条件に注意することを推奨する

後記

この研究は，2022年より続く，税理士法人日本経営と筑波大学との共同研究シリーズの一つです。共同研究を始めた当時，私は博士前期課程1年生であり（記事執筆時は博士後期課程2年生），手に入れた仕訳データの貴重さ，面白さ，奥深さを理解していませんでした。そこから約4年をかけて，仕訳データには複式簿記特有の情報が含まれていそうなこと，良い予測モデルを作るために必要な仕訳データの前処理，そして実験のフレームワークなどを整備していき，ようやく対外的に一定の貢献が認められる研究成果を出すことができました。この過程では，共同研究先の皆様は，現場の状況，仕訳データの見方，予測タスクの設定などについて，数多くの助言をしてくださいました。この場を借りて，感謝申し上げます。

この研究は，複式簿記データサイエンスの第一歩となり得る研究ですが，論文に記載した通り，まだまだ数多くの課題が残されています。今後は，産学連携研究としての位置づけを忘れることなく，社会的にも学術的にも意義のある研究を推進したいと思います。

この研究に興味を持った方は，原著論文も併せてご確認ください。
R. Motai, M. Kamebuchi, S. Watanabe, R. Matsumoto, K. Azuma, and Y. Okada, “Cash-flow prediction model using graph neural networks and spatiotemporal information from double-entry bookkeeping data,” in 2025 IEEE International Conference on Big Data (BigData), December 2025, pp. 2431–2439.

本研究は，JSPS科研費（25KJ0671，23K22166）および筑波大学データサイエンス・エキスパート・プログラムからの助成を受けたものです。

参考文献

[1] M. Zupan, “Accounting journal entries as a long-term multivariate time series: Forecasting wholesale warehouse output,” Intelligent Systems in Accounting, Finance and Management, vol. 31, no. 1, article e1551, March 2024.

[2] R. Motai, S. Mashiko, M. Kamebuchi, S. Watanabe, R. Matsumoto, and Y. Okada, “Practical experiment of predicting cash flows with LSTM and double-entry bookkeeping data,” in 2024 IEEE International Conference on Big Data (BigData), December 2024, pp. 2360–2364.

[3] M. Jin, H. Y. Koh, Q. Wen, D. Zambon, C. Alippi, G. I. Webb, I. King, and S. Pan, “A survey on graph neural networks for time series: Forecasting, classification, imputation, and anomaly detection,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 46, no. 12, pp. 10466–10485, December 2024.

[4] B. Yu, H. Yin, and Z. Zhu, “Spatio-temporal graph convolutional networks: A deep learning framework for traffic forecasting,” in Proceedings of the 27th International Joint Conference on Artificial Intelligence, July 2018, pp. 3634–3640.

[5] S. Hochreiter and J. Schmidhuber, “Long short-term memory,” Neural Computation, vol. 9, no. 8, pp. 1735–1780, November 1997.

[6] G. E. P. Box and G. M. Jenkins, Time Series Analysis: Forecasting and Control, Rev. ed. In Holden-Day series in time series analysis. San Francisco: Holden-Day, 1976.