【Python/OpenCV】単なる画像分割じゃない！位置解析で均一なカード画像を切り出すスクリプト開発記

こんにちは、Tech Samuraiです！
今回は、一枚の画像にまとめられた複数のアイコン（カード）を、それぞれ個別のファイルに自動で分割するPythonスクリプトを開発した際の、試行錯誤の全記録を共有します。

最初は「画像を均等に切るだけで簡単だろう」と高を括っていましたが、最終的に満足のいく結果を得るまでには、いくつかの「壁」と「発想の転換」が必要でした。これは、単純な問題に見えて、実は奥深い画像処理の世界を探検する物語です。

目標： 1枚の画像に3行2列で配置された6つのアイコンを、個別のファイルに分割する。

まず最初に試したのは、Pythonの画像処理ライブラリ`Pillow`を使い、画像を単純にグリッドで6等分する方法です。画像全体のサイズを取得し、幅を2で、高さを3で割って、機械的に切り出しました。

課題： この方法では、各アイコン間の余白やレイアウトの微妙なズレを考慮できませんでした。結果、アイコンが途中で切れたり、不要な余白が多く含まれたりと、精度が低く、使い物になりませんでした。

単純な分割がダメなら、画像の中身を「認識」すれば良い。そう考え、より高度な画像処理ライブラリ`OpenCV`を導入しました。アイコンの輪郭を自動で検出し、その部分だけを切り出す作戦です。

課題： この方法は一歩前進でしたが、各アイコンの形状が異なるため、検出される四角形のサイズがバラバラになりました。結果として、切り出される画像の大きさが統一されず、不揃いになってしまいました。

アイコン自体の形がバラバラなら、全てのアイコンが乗っている「角の丸い白いカード」を検出すれば、サイズが揃うのではないか？と考えました。

cv2.threshold`の閾値を微調整し、画像全体の真っ白な背景と、カード部分のわずかに異なる白とを区別させ、カードの輪郭を検出。しかし、この方法でも、輪郭検出のわずかな誤差により、切り出されるカードの大きさが数ピクセル単位で異なってしまう問題は解決しませんでした。

ここで、私はプロジェクトの重要な前提条件に立ち返りました。「**画像内のカードは、常に同じ配置・同じサイズである**」ということです。このルールを利用しない手はありません。

最終的な解決策は、個々の輪郭の精度に頼るのではなく、**全体のレイアウトから「理想的なカードサイズ」を逆算する**アプローチです。

成果： この方法により、輪郭検出のわずかな誤差は中心座標の特定にのみ影響し、最終的な切り出しサイズは計算された統一サイズで行われるため、出力される全画像のサイズが完璧に一致するようになりました。これこそが、求めていた理想的な結果です！

コアロジックが完成したので、最後にスクリプトの利便性を高めます。Pythonの`os`および`glob`ライブラリを使い、指定したフォルダ内にある全ての画像を一括で処理する機能を追加しました。分割後の画像は、元のファイル名ごとに作成されたサブフォルダ内に保存されるようにし、整理しやすくしました。

これにより、大量の画像を手作業なしで一度に処理できる、実用的なツールが完成しました。

この一連の「アジャイルな」開発プロセスを経て完成したスクリプトの全コードは、ImgProcKit (Image Processing Kit) と名付けた、以下のGitHubリポジトリで公開しています。

将来的には、今回の画像分割スクリプト以外にも、様々な画像処理の便利ツールをこのリポジトリに追加していく予定です。

「画像を6つに切る」という単純なタスクから始まったこのプロジェクトは、最終的に「複数の不正確な情報から、統計的に最も確からしい答え（平均サイズ）を導き出し、それを元に均一な結果を得る」という、データ解析にも通じる、非常に洗練されたアプローチにたどり着きました。

プログラミングの面白さは、このように試行錯誤を繰り返し、よりエレガントな解決策へとたどり着く、そのプロセスそのものにあるのかもしれません。

おすすめ投稿