このページの先頭です

メニューを飛ばして本文を読む

ここから本文です

サイト内の現在位置

研究者情報:研究・産学連携

研究室紹介OPAL-RING
高橋(裕) 研究室

画像解析・生成に関する研究

所属 大学院情報理工学研究科
総合情報学専攻
メンバー 高橋 裕樹 准教授
所属学会 芸術科学会、電子情報通信学会
研究室HP http://img2.hc.uec.ac.jp/
印刷用PDF

掲載情報は2015年8月現在

高橋 裕樹
Hiroki TAKAHASHI
キーワード

画像処理、コンピュータグラフィックス(CG)、パターン認識、3次元モデル検索

研究概要

画像認識、画像解析、画像生成、画像検索、画像処理技術の開発

デジタルカメラや携帯電話が普及し、高機能化することによって、社会にはさまざまな画像が溢れ、個人でも多くの画像を撮影し保持するようになってきた。
当研究室では、この溢れんばかりに増大する画像を研究対象とし、画像認識、画像解析、画像生成、画像検索などを行うことによって、コンピュータによる、より人間の感覚に近い画像処理技術の開発を目指している。
人間は、ある画像を見ると、その画像中に含まれるさまざまな事柄を理解したり、その画像の特徴を感じたりすることができる。例えば、画像の中の風景がどこなのか、誰が写っているのか、または画像の中にどのような文字が書かれているのかを読み取ることができる。
このように人間が画像から得ることができる理解・認識を、当研究室では、コンピュータで処理することを主な研究課題としている。このような応用システムを構築するため、ある与えられた画像に対して、画像から何らかの特微量を取り出し、画像中に含まれる対象の切り出し・識別・認識を行ったり、画像中のさまざまな特徴を分析する基礎研究も行っている。これらの研究によって、画像から得られた情報をもとに画像を生成したり、画像を利用してコンピュータ(仮想空間)と人間(現実空間)のシームレスなインタラクションの実現を目指している。
本研究を進めることによって、社会においてあらゆるシーンで生活をより便利にスムーズにすることができると考えている。例えば、画像から文字領域を抽出して認識することによって、画像から重要な情報の抽出、画像検索のための画像のラベル付け、シーン理解の補助に役立つと考えられる。
これらのことが実現すれば、私たちの生活シーンの中で、例えば旅行中に携帯電話で撮影した街中の風景の中から文字を抽出し、理解困難な現地の言語を翻訳し意味を理解したり、その字列から今どこにいるかなどのナビゲーション情報を取り出したりと、携帯電話やデジタルカメラが1つあれば世界中どこへでも旅行に行けるようなシステムが可能になる。
さらに、画像データの直感的な検索を目的として、人間の視覚特性に基づき、画像の大局的な色分布を利用した画像の領域分割手法の検討と認知心理学に基づいた画像検索インタフェースの検討も行っている。また、企業との共同研究では、工場ラインなどで人間が目視で行う製品の最終チェックを画像処理技術で代替する技術を開発している。
このように当研究室では、画像認識・解析・生成・検索・処理技術の開発など、一般で活用できる分野での実用化に向けての研究を行っている。

アドバンテージ

劣化画像からも文字抽出・認識可能に

従来の文字抽出・認識の研究は、印刷された書類や定形の書式にあわせて書いた手書き文字のための研究がメインに行われていたが、現在では、撮影条件や対象文字に関して制限をあまり設けずに撮影した画像の中の文字を対象とした研究に移行している。
当研究室では、単に低解像度画像から文字を取り出す技術にとどまらず、文字抽出・認識処理に対して悪条件となりうる天候や照明、陰影などの変化から影響を受けにくい処理方法の研究を進めている。
また、画像解析に加え、人間の知覚情報処理に近い画像領域分割手法を考えることで、画像の整理・検索のために画像と画像の類似性を比較して検索に役立てるツール作りにも注目している。現在利用可能な画像検索では、一般的に、画像に付けたキーワードによって検索する方法がとられているが、本研究を活用することで、画像そのものの色や形などから検索することが可能となる。例えば、スケッチとして書いた絵からそのスケッチに対応する画像が検索できると、検索がさらに便利になり、検索効率アップも期待できる。このような画像検索が直感的、迅速に行えるツール作りを研究している。

今後の展開

3次元モデル検索

今後は現状の画像認識、画像解析の精度向上のための研究を進めるとともに、3次元モデル検索のための研究も進めていく予定である。今やCGなどの映像を自分で作る時代になったが、これからもその傾向が強まり、現状の画像と同じ状況が、近い将来3次元モデルにもあてはまるだろうと考えている。そこで、3次元モデルを再利用してより手軽に映像制作ができる環境を整えるべく、3次元モデル検索のための3次元モデルの記述子やモデル同士の類似性を調べる研究も進めている。

研究・産学連携