IPと関連する情報を更新するためにマシンラーニング技術を活用しています。IPと関連する情報が紐づいたデータセットを基に学習モデルを生成することで、IPに対して付加すべき情報を予測することが可能です。Geolocation Technologyでは、Amazon SageMakerを用いて学習及び予測を行う内部システムを構築しております。どこどこJPの判定率にどの程度寄与したかを調査した結果をまとめました。
以前の導入に関する記事:
AWS SageMakerを用いたIP Geolocationシステム | IT情報メディア「LIVRA」
Amazon SageMakerとは
Amazonによって提供されるマシンラーニング等を利用するプラットフォームになります。
データの前処理~学習~予測部分すべてを管理でき、また大量の学習処理も分散処理により大幅に時間短縮が見込めるサービスとなります。
AWS上のサービスのため、他のAWSサービスとの連携も容易です。
Amazon SageMaker(機械学習モデルを大規模に構築、トレーニング、デプロイ)| AWS
各AWSとの連携とSageMakerの構成について
AWSサービスを複数組み合わせることで、定期的に学習モデルを更新しながら最新の情報をIPアドレスと結びつける取り組みを行っております。主に地域情報に対して学習モデルを用いた判定を行っております。
S3に保存されるIPおよび関連情報データは、日ごとに最新情報が保管されています。この情報を基に数日から数週間のサイクルで判定モデルを最新化し、適切な判定となるシステムでとなっています。
本システム導入により、作業工数1300時間の効率化に繋がりました。
判定精度の推移について
どこどこJPのサービスにおいて判定精度評価を実施した結果をグラフにまとめました。本結果より、データ適用が始まった2023年3月より判定率の精度向上が確認できました。おおよそ15~20ポイントほどの精度向上が確認できる結果となりました。
※地理情報のみに対する判定精度の結果
まとめ
機械学習システムの導入により、判定精度が向上することが確認できました。高頻度でモデル更新することが可能なため、短時間で属性が変わるようなIPに対して効果的に機能したと考えられます。
今後はさらなる判定精度の向上及び維持に活用することと共に、他の属性情報に関しても同様に機械学習等のご術活用を進めてまいります。