4階層防御モデルで企業公式サイトを85%精度で自動検出

技術仕様(実装済み機能)
✓ 企業データ読み込み → Google Sheets APIで企業情報取得
✓ 検索 → Google Custom Search APIで公式サイト検索
✓ HTML解析 → BeautifulSoup4でページ構造解析
✓ AI判定 → 4階層防御モデルによる評価
✓ 自動書き込み → 検証結果をGoogle Sheetsに記録
✓ ポータル除外 → 60+のポータルサイトを自動除外
なぜこのシステムを作ったのか
企業リスト作成の仕事をさせていただいているときに、かなり時間がかかっていました。
手動確認では限界があり、「AI判定で自動化できないか?」と考えて開発しました。
システム概要
Google Sheetsの企業リストから、各企業の公式ホームページURLをGoogle Custom Search APIで検索し、独自の4階層防御モデルによるAIスコアリングで信頼度を判定。
結果を自動でシートに書き込みます。
4階層防御モデル(独自技術)
第1層:著作権表示チェック(3-10点)
第2層:企業情報ページ存在(3-8点)
第3層:タイトル・見出し確認(5-10点)
第4層:地域情報一致度(3-8点)
ボーナス:ドメイン類似度(1-5点)
ペナルティ:ポータルサイト除外(-100点)
実際の導入効果
手動確認時間:1企業1分 → ほぼゼロ(99%削減)
精度:基本成功率85%以上
処理能力:1日100企業まで自動処理(追加料金を支払えば何件でも可能)
誤検出対策:60+ポータルサイト除外で精度向上
こんな方におすすめ
✓ 企業リストを大量に管理している方
✓ 営業先リストの信頼性を確保したい企業
✓ マーケティングリサーチ会社
✓ 手動での企業HP確認に時間を取られている方
あなたの企業リスト管理も自動化してみませんか?
少しでも気になるという方は、お気軽にお問い合わせください。
