こんにちは、デジタルボーイです。今回は建設業データのデータサイエンス応用例について解説したいと思います!

デジタルボーイです。
データサイエンス歴20年以上のおっさんです。中小企業診断士として、データサイエンス、WEBマーケティング、SEOに関するデータ分析、コンサルティングの仕事をしています。自己紹介の詳細はコチラ
建設業におけるデータサイエンス
建設業界では、工期の管理、コストの最適化、安全対策など、金額が大きいだけに、しっかりとした意思決定が求められる場面が数多くあります。こうした状況で、経験や勘に頼るだけでは限界があり、データに基づいた判断の重要性がますます高まっています。ここ最近、急速に建設業におけるデータ分析の活用が進んでいるのも、こうした背景があるからではないでしょうか。
最近では、IoTセンサーを活用した現場のモニタリングや、AIを用いた工期遅延の予測、資材価格の変動分析などが注目を集めています。例えば、作業員の動線を解析し、無駄な移動を減らすことで生産性を向上させる取り組みや、過去の気象データをもとに天候リスクを事前に考慮する計画策定が実施されるようになっています。こうした技術の進歩により、従来の建設管理がより効率的かつ戦略的に進められるようになりました。
個人的には、正直にいうと、建設業のデータ分析はあまり得意ではありません。理由は、データの項目が、コンクリートの〇〇とか、ALCの〇〇とか、鉄筋・鉄骨の構造だとか、、、専門的な用語が多く建設の専門家でないので、意味がわからないことがよくあるんですよね。しかも人の心理を主に対象とするマーケティングは結果も誤差が多く、誤差も含めてエイヤッと分析することが多いですが、建設については、ある分野では誤差がほとんど生じない(例えば、外壁資材の数量を予測する場合、ほぼ外壁面積で誤差なく算数の世界で予測できる、などなど)ケースもあります。このようなほぼほぼ誤差の生じないケースと誤差の生じるケースを場合わけしながら、予測モデルを構築しないといけないなんてことがよくあり、マーケティングに比べ、きめの細かな予測モデルの構築が必要になるケースが多々あります。
とは言え、いきなり難しい予測モデルの構築なんかをしなくとも、まず初めにデータの見える化・可視化を進めるだけでも、非常に効果を発揮します。なので、まず初めに建設業回の見える化・可視化を中心に、これまで僕がデータ分析コンサルとして携わってきた建設業におけるデータサイエンスについて、具体的にみていきたいと思います!
工事進捗率の推移モニタリング
まずは、工事プロジェクトの進捗率を可視化し、工期遅延の兆候を把握する方法についてみていきましょう。建設現場では、工事が計画通り進んでいるかを常に把握することが重要ですよね。遅延が発生すると、人員や資材の追加、工程の見直しなどの対応が必要になります。そのため、進捗状況を時系列でグラフ化し、予定と実績のギャップを可視化することで、早期に問題を発見し適切な対策を講じることができます。
進捗率の可視化で何がわかるのか
工事進捗率の推移を時系列グラフにすることで、次のような点が明確になります。
- 予定と実績の差がどの時点で発生したのか
- 遅延が一定の傾向をもっているか(例えば、毎月の終盤に遅れが発生しやすい)
- どの工程でボトルネックが発生しているのか
このグラフには、X軸に工期(日付)、Y軸に進捗率(%)を設定し、予定進捗と実績進捗の2本の折れ線グラフを描くのが一般的です。予定の進捗は直線的に増加することが多いですが、実績の進捗は突発的な遅延やリカバリにより変動するため、ギャップの大きさを可視化することで対応の優先順位を判断できます。
遅延兆候の把握とリカバリ策の立案
グラフ化することで、どの段階で遅れが発生し始めたのかが明確になります。例えば、ある特定の時点から実績の進捗率が予定より下回るようであれば、その段階でのリソース不足や天候の影響が疑われます。早めにこうした問題を発見すれば、追加の作業員を投入する、別工程と並行作業を行うなど、適切なリカバリ策を立てることができます。
僕のデータ分析の経験上、遅延が発生した段階で単にスケジュールを見直すのではなく、どの要因が影響しているのかを定量的に特定することがポイントです!例えば、過去の工事データと照らし合わせて、「この期間の雨天率が高い場合は遅延が発生しやすい」などの傾向を見つけると、事前に計画を調整することが可能になります。
グラフの活用例
たとえば、以下のような時系列グラフを用意すると、進捗管理がよりわかりやすくなります。
- 進捗率推移グラフ
予定進捗と実績進捗の2本の折れ線グラフを表示し、進捗のズレを視覚的に把握 - 遅延率のヒートマップ
過去の工事データから、どのタイミングで遅延が発生しやすいかを色で強調表示 - リカバリ効果の分析
過去にどのリカバリ策が有効だったのかをデータで検証し、最適な対策を導き出す
こうした可視化により、現場の管理者がデータをもとに迅速に意思決定できるようになります。単に「遅れている」という事実を把握するだけでなく、「なぜ遅れているのか」「どう対策すればよいのか」をデータで明確にすることが、進捗管理の鍵となりますね!
数字の見方と施策立案例
では、具体的数値を見ながら、データ分析コンサル的に数字の見方と施策の立案の流れを見ていきましょう。
日付 | 計画進捗率 | 実績進捗率 |
---|---|---|
2024-01-01 | 0% | 2% |
2024-01-02 | 3% | 2% |
2024-01-03 | 6% | 10% |
2024-01-04 | 10% | 17% |
2024-01-05 | 13% | 12% |
2024-01-06 | 17% | 16% |
2024-01-07 | 20% | 28% |
2024-01-08 | 24% | 27% |
2024-01-09 | 27% | 25% |
2024-01-10 | 31% | 33% |
2024-01-11 | 34% | 32% |
2024-01-12 | 37% | 35% |
2024-01-13 | 41% | 42% |
2024-01-14 | 44% | 35% |
2024-01-15 | 48% | 39% |
日付 | 計画進捗率 | 実績進捗率 |
---|---|---|
2024-01-16 | 51% | 48% |
2024-01-17 | 55% | 50% |
2024-01-18 | 58% | 60% |
2024-01-19 | 62% | 57% |
2024-01-20 | 65% | 58% |
2024-01-21 | 68% | 76% |
2024-01-22 | 72% | 71% |
2024-01-23 | 75% | 76% |
2024-01-24 | 79% | 72% |
2024-01-25 | 82% | 80% |
2024-01-26 | 86% | 86% |
2024-01-27 | 89% | 83% |
2024-01-28 | 93% | 94% |
2024-01-29 | 96% | 93% |
2024-01-30 | 100% | 98% |

データの考察
このプロジェクトの計画進捗率と実績進捗率を比較すると、前半と後半で異なる傾向が見られます。1月1日から1月10日までは、計画通り進んでいる部分もあるものの、1月5日(計画進捗率13.79%)では実績が12.62%と若干遅れていますね。一方で、1月7日には実績が28.58%と急上昇し、計画(20.68%)を大きく上回る動きが見られます。これは、特定の工程が前倒しで進んだ可能性を示唆しています。
中盤になると、1月14日(計画44.82%)で実績が35.26%と、計画との差が広がる時期がありました。その後、1月16日以降は計画との差が縮まり、1月18日(計画58.62%)では実績が60.19%と、むしろ計画を超える進捗となっています。これを見ると、前半の遅れを挽回するために、どこかでリソースを増やした、または工程を変更した可能性があります。
終盤の1月28日(計画93.10%)では実績が94.98%と、計画を超えています。このように、最終的には遅れを取り戻した形になっていますが、その過程でどのような対応がされたのかを分析することが、今後のスケジュール管理の改善につながるのです!
課題解決のための施策例
このデータから考えられる課題は、前半に発生した進捗の遅れと、その後の回復プロセスです。特に、1月14日から1月16日の間で遅れが顕著になったことから、この期間に何が起きたのかを現場の記録と照らし合わせることが重要です。天候の影響があったのか、資材の納品遅れがあったのか、あるいは人員不足が発生していたのかを確認することで、次回のプロジェクトでは事前のリスク対策が可能になります。
また、後半に進捗が急速に回復している点から、追加人員の投入や作業工程の圧縮が行われた可能性があります。しかし、このような対応は労働負荷の偏りやコスト増加につながるため、同じことを繰り返さないよう、最初から余裕を持ったスケジュールを立てることが望ましいですね!
具体的な施策としては、(1) 初期の遅れを防ぐための進捗確認の頻度を増やす、(2) 遅延発生時にすぐ対策できるよう、リカバリ計画を事前に準備しておく、(3) 後半の急激な巻き返しを避けるため、作業負荷を均等に分配する、といった点が考えられます。これらを取り入れることで、より安定した進捗管理ができるようになるでしょう!
労働者の稼働率と残業時間のモニタリング
続いて、現場ごとの作業員の稼働率や残業時間を可視化し、過労による事故リスクや人員配置の最適化に活用する方法についてです。建設業では、限られた人員で効率よく作業を進めることが求められます。しかし、作業負担が偏ると、過労による生産性低下や安全リスクの増大につながります。そこで、稼働率と残業時間のデータを時系列で分析し、どの現場で負担が集中しているのかを明らかにすることが重要です。
稼働率と残業時間の可視化
労働者の稼働率を分析する際には、総労働時間、残業時間、作業人数の推移を一つのグラフで表現することが効果的です。たとえば、X軸を日付、Y軸を労働時間とし、通常勤務時間と残業時間を色分けした棒グラフを作成します。さらに、作業員の数を折れ線グラフで重ねると、人員配置と作業負担の関係が一目で分かるようになります。
このデータをもとに、以下のような傾向を読み取ることができます。
- ある現場で特定の期間に残業が急増していないか
- 人員数が一定なのに、総労働時間が増加していないか(負担が偏っている可能性)
- 週単位、月単位での労働負荷のパターンに偏りがないか
事故リスクの予測と人員配置の最適化
労働時間のデータを蓄積すると、過労が原因と考えられる事故やミスの発生傾向を分析することができます。例えば、過去のデータから「一人あたりの月間労働時間が250時間を超えると事故率が上がる」といった傾向が確認できれば、その基準を超えないように早めに人員調整を行うことが可能です。
また、現場ごとの労働負荷を均等にするために、人員配置の最適化を行うことも重要です。例えば、次のような方法が考えられます。
- 残業時間が一定の閾値を超えた場合、他の現場から応援を出す
- 定期的に人員をローテーションし、特定の作業員に負担が集中しないようにする
- 繁忙期を見越した適切な増員計画を立てる
僕のデータ分析の経験上、単に残業時間を見るだけでなく、業務内容ごとの作業時間を分解し、どの業務に時間がかかっているのかを特定することがポイントです!たとえば、「資材の運搬作業が1日あたり2時間を占めている」ことが分かれば、機械化や動線の見直しで大幅に負担を軽減できる可能性があります。
可視化の実践例
この分析を実際に活用するには、次のようなデータをグラフで表現するのが有効です。
- 労働時間の推移グラフ
日ごとの総労働時間と残業時間の推移を棒グラフで表示し、急激な変化を見つける - 人員配置と労働負荷の相関分析
作業員数と労働時間を重ねて表示し、適切な人員配置ができているかを確認 - 事故発生率との比較
過去の事故発生データと労働時間を照らし合わせ、リスクが高まるラインを特定
こうしたデータをもとに、現場ごとの業務負担をバランスよく分配することで、作業効率を向上させながら安全性も確保できるのです。建設業における労働管理は、単なる労働時間の記録ではなく、適切なデータ分析を行うことで大きく改善できる領域ですね!
数字の見方と施策立案例
では、具体的数値を見ながら、データ分析コンサル的に数字の見方と施策の立案の流れを見ていきましょう。
日付 | 作業員数 | 総労働時間 | 残業時間 |
---|---|---|---|
2024-01-01 | 21 | 126 | 0 |
2024-01-02 | 18 | 126 | 18 |
2024-01-03 | 27 | 189 | 0 |
2024-01-04 | 29 | 174 | 29 |
2024-01-05 | 25 | 150 | 75 |
2024-01-06 | 22 | 132 | 66 |
2024-01-07 | 27 | 216 | 54 |
2024-01-08 | 19 | 152 | 57 |
2024-01-09 | 21 | 168 | 42 |
2024-01-10 | 24 | 168 | 72 |
2024-01-11 | 17 | 136 | 0 |
2024-01-12 | 21 | 147 | 63 |
2024-01-13 | 25 | 175 | 50 |
2024-01-14 | 25 | 200 | 50 |
2024-01-15 | 22 | 154 | 22 |
日付 | 作業員数 | 総労働時間 | 残業時間 |
---|---|---|---|
2024-01-16 | 19 | 152 | 0 |
2024-01-17 | 18 | 144 | 54 |
2024-01-18 | 22 | 132 | 22 |
2024-01-19 | 22 | 176 | 66 |
2024-01-20 | 17 | 102 | 51 |
2024-01-21 | 20 | 160 | 20 |
2024-01-22 | 19 | 152 | 19 |
2024-01-23 | 16 | 96 | 16 |
2024-01-24 | 22 | 132 | 22 |
2024-01-25 | 26 | 208 | 26 |
2024-01-26 | 28 | 196 | 84 |
2024-01-27 | 20 | 120 | 20 |
2024-01-28 | 16 | 112 | 0 |
2024-01-29 | 26 | 182 | 52 |
2024-01-30 | 19 | 133 | 19 |

データの考察
このデータを見ると、労働者の稼働状況に大きな変動があることが分かります。例えば、1月1日には作業員数が21人で総労働時間は126時間、残業時間は0時間と理想的な状態です。しかし、1月5日になると作業員数が25人と大きな変化はないにもかかわらず、総労働時間は150時間、残業時間が75時間と急増しています。これは、突発的な業務量の増加や、計画されていなかった作業が発生した可能性を示唆していますね。
さらに、1月10日には作業員数24人、総労働時間168時間、残業時間72時間となり、再び残業が多発しています。特に、1月26日には作業員数28人で総労働時間196時間、残業時間84時間と、この期間の中で最も高い水準になっています。逆に、1月23日を見ると、作業員数16人、総労働時間96時間、残業時間16時間と、比較的安定した労働環境になっています。このようなデータを分析することで、どのタイミングで労働負荷が高まるのかを特定することができます!
課題解決のための施策例
このデータから考えられる課題は、特定のタイミングで発生する過度な残業です。例えば、1月5日や1月26日は特に残業が多く、従業員の負担が増加していることが分かります。このような状況が続くと、労働者の疲労が蓄積し、生産性の低下や安全リスクの増加につながる可能性があります。特に、突発的な業務増加による残業は、計画性の欠如を示している可能性があり、改善が必要です。
改善策として、まずは各工事の工程を見直し、繁忙期を予測して事前に人員を増やすことが重要です。例えば、1月26日のように残業が多くなるタイミングでは、前もってシフトを調整し、作業を分散させることで負担を軽減できます。また、過去のデータをもとに、どの業務が残業の原因となっているのかを分析し、特定の作業が集中する日程を避けるスケジュール管理が求められます。
僕のデータ分析の経験上、単に残業時間を減らすのではなく、作業効率を向上させるためにどのプロセスで無駄が発生しているのかを特定することがポイントです!例えば、1月5日と1月6日は連続して残業時間が高くなっていますが、この期間に共通する業務がある場合、それを自動化や事前準備で軽減できる可能性があります。
このように、労働時間のデータを活用すれば、無理なく稼働率を最適化し、安全で効率的な労働環境を整えることができますね!
CO2排出量の予測
続いて、建設前の企画段階で建物の資材、大きさ、面積などからCO2排出量を予測する方法についてです。環境規制の強化やカーボンニュートラルの推進により、建設業界でもCO2排出量の管理が重要視されるようになっています。特に、建築資材の選定や設計段階での判断が、最終的なCO2排出量に大きな影響を与えるため、事前のデータ分析が有効なのです。
CO2排出量を予測するためのデータ
CO2排出量を予測するには、過去の建築プロジェクトのデータをもとに、建物の仕様と排出量の関係をモデル化することが必要です。具体的には、以下のようなデータを収集し、それぞれがCO2排出量に与える影響を分析します。
- 建築面積や延床面積:建物が大きいほど、使用する資材や施工のエネルギー消費が増え、排出量が増加する
- 使用する主要資材の種類と量:鉄筋コンクリート、木材、ガラスなど、資材ごとにCO2排出係数が異なる
- 施工プロセス:建設期間や使用する建設機械の種類、エネルギー消費量
- 地域の気候条件:寒冷地や湿度の高い地域では、施工プロセスが異なり、間接的にCO2排出量に影響を与えることがある
このようなデータを用いることで、建築計画段階でのCO2排出量の見通しを立て、より環境負荷の少ない設計へと導くことができます。
予測モデルの活用と精度向上
建築におけるCO2排出量の予測には、機械学習の回帰モデルを用いることが一般的です。例えば、線形回帰やランダムフォレスト回帰などの手法を用い、過去のデータから最適な予測式を導き出します。特に、資材の組み合わせや施工方法の影響が複雑なため、非線形の影響を考慮できる勾配ブースティング系のモデル(LightGBMなど)が有効な場合もあります。
モデルの精度を向上させるためには、正確な入力データの収集が不可欠です。特に、資材ごとのCO2排出係数や、建設機械のエネルギー消費量などは、一般的なデータセットでは不足しがちなので、業界標準のデータベースを活用することが重要です。
僕のデータ分析の経験上、単純に建築面積や資材量だけを見るのではなく、施工プロセスの違いも考慮することがポイントです!例えば、プレキャストコンクリートを活用することで、現場施工よりCO2排出量を削減できるケースがあり、こうした要素もデータに含めるとより実用的な予測が可能になります。
CO2削減への応用
このような予測モデルを活用することで、建築前の段階でCO2排出量を試算し、環境負荷を低減する設計へと調整することが可能になります。例えば、次のような施策が考えられます。
- CO2排出量のシミュレーション
設計案ごとにCO2排出量を試算し、最も環境負荷の少ない案を選定 - 低排出資材の選定
代替可能な資材を比較し、CO2排出量を削減できる組み合わせを提案 - 施工方法の最適化
省エネ施工方法を導入し、工事全体の排出量を抑制
こうしたアプローチにより、建設業界の環境負荷を低減し、持続可能な社会づくりに貢献できますね!
重回帰分析によるCO2排出量予測の活用
建設プロジェクトにおけるCO2排出量の予測には、重回帰分析が有効な手法となります。これは、複数の要因がCO2排出量に影響を与えるため、それぞれの関係性を数式化し、企画段階での数値をもとに将来の排出量を推定できるからです。
具体的には、建築面積、使用する資材の種類と量、工法、建設期間などの変数を説明変数として設定し、実際に建築後に測定したCO2排出量を目的変数とすることで、予測モデルを構築できます。こうしたモデルを用いることで、過去の実績を活かし、新規プロジェクトにおける環境負荷の事前評価が可能になりますね!

この手法を活用することで、企画段階での設計変更や材料の選定時に、どの要素が排出量に大きく影響を与えるのかを定量的に判断できるようになります。また、建設コストや工期と環境負荷のバランスを取りながら、より持続可能な建築計画を立案することができるのです!
案件の受注確率予測
続いて、過去の入札データや顧客の特性を分析し、どの案件が受注できる可能性が高いかを予測する方法についてです。建設業における営業活動では、限られたリソースをどの案件に投入するかが重要な判断となります。すべての案件に均等に力を注ぐのではなく、成功の可能性が高いものに優先的に取り組むことで、受注率の向上と効率的な営業活動を実現できます。そのために、データ分析を活用し、過去の傾向から受注確率を予測する手法が有効なのです。
受注確率を予測するためのデータと分析
受注確率を予測するには、過去の入札結果と案件の特性を数値化し、機械学習モデルを用いて学習させることが基本となります。具体的には、次のようなデータを活用します。
- 案件の特性(案件の種類、規模、立地、工期)
- 顧客の特性(発注者の業界、過去の取引履歴、競争状況)
- 競合情報(競争相手の数、過去の入札傾向、過去の受注状況)
- 入札価格(自社および競合他社の入札額、過去の最適価格)
こうしたデータをもとに、ロジスティック回帰やXGBoostなどのモデルを用いて受注確率を予測します。モデルの訓練が完了すると、新しい案件に対しても、「受注確率が高い案件」や「価格をどの程度調整すれば受注しやすくなるか」などの示唆を得ることができますよね!
僕のデータ分析の経験上、単純に受注確率を算出するだけでなく、どの変数が受注に最も影響を与えているのかを特定することがポイントです!例えば、価格が主要因なのか、それとも過去の取引履歴が影響しているのかを可視化することで、営業戦略の精度が向上します。
受注確率予測の活用と営業戦略
この分析を営業戦略に取り入れることで、効果的なアプローチが可能になります。例えば、受注確率が高い案件を事前に特定し、営業リソースを集中させることで、ムダのない営業活動が実現できます。また、過去のデータから「価格調整の最適範囲」を算出し、競争力を確保しながら利益を確保する価格戦略を立案することも可能です。
さらに、受注に影響を与える要因を明らかにすることで、今後の戦略策定に役立ちます。たとえば、データ分析の結果「過去の取引回数が多い顧客ほど受注確率が高い」ことが分かった場合、既存顧客との関係を強化するための施策を打つことができます。また、「特定の競合と競争した際に受注確率が低下する」ことが判明した場合、その競合が強みを持つ案件を避けたり、別の競争軸で差別化を図るなどの対策を講じることができます。
このように、受注確率の予測を活用することで、より戦略的な営業活動が可能になります。感覚や経験だけに頼るのではなく、データをもとに意思決定を行うことで、建設業の営業効率を飛躍的に向上させることができるのです!
数字の見方と施策立案例
では、具体的数値を見ながら、データ分析コンサル的に数字の見方と施策の立案の流れを見ていきましょう。

データの考察
このデータを見ると、受注確率に最も影響を与えている要因は「顧客の規模(46%)」であることがわかります。つまり、大企業や規模の大きな発注者ほど、受注の可能性が高くなる傾向があると考えられますね。これは、過去の取引実績や安定性が評価されやすい発注者ほど、特定の企業に発注を継続する傾向があることを示唆しているのかもしれません。
次に重要な要因は「過去取引回数(19%)」です。これは、一度取引した顧客との継続的な関係が受注確率に大きく影響することを示しています。過去に何度も仕事を依頼されている企業は、新規の企業よりも信頼されやすく、受注につながりやすいのです!また、「入札価格(15%)」の重要度も無視できませんが、予想よりも低い数値である点に注目です。一般的に、価格競争が激しい業界では入札価格が受注を左右する要素として大きくなるはずですが、このデータではそこまで影響が大きくないことがわかります。
一方、「競争企業数(4%)」「地域の影響(7%)」「納期要求(7%)」は比較的重要度が低い要因となっています。競争相手の多さが必ずしも受注に影響するわけではなく、地域や納期に関する要件もそこまで大きな影響を与えていないことが示されていますね!
課題解決のための施策例
このデータから考えられるのは、受注率を上げるためには「顧客の規模」と「過去取引回数」を意識した営業戦略が有効であるということです。特に、大企業や長期的な取引関係が見込める顧客を優先的にターゲットとすることで、受注率を高めることができるでしょう。また、新規顧客の獲得に力を入れる場合でも、一度の取引で終わらせず、継続的な関係を築くことが重要になります。
価格競争に頼らず受注を増やすためには、入札価格以外の要因で差別化を図る必要があります。例えば、提案内容の充実やアフターサポートの強化、企業の信頼性を高める取り組みが効果的です。競争企業の数が少ないからといって油断するのではなく、競合が少ない案件を狙うことで確実に受注を増やす戦略も考えられます!
具体的な施策として、(1) 大企業との取引を増やすための営業アプローチを強化する、(2) 過去の取引履歴を分析し、長期的な関係を築ける顧客に対して特別な提案を行う、(3) 価格競争に依存せず、付加価値のある提案を行う、といったアプローチが考えられます。データをもとにした戦略的な営業活動を進めることで、より効果的な受注拡大が期待できますね!
まとめ
以上、建設業におけるデータサイエンスの具体例でした。ぜひ、チャレンジしてみてください!