loog

Open CV AI Kit

January 06, 2021

Kickstarter で 2020年7月末に注文した、Open CV AI Kit が届きました。

https://www.kickstarter.com/projects/opencv/opencv-ai-kit?lang=ja

OAK-1 と OAK-D を1つづつ買いました。

凄く人気らしいということと、Open CV の名前に惹かれて適当に注文したため、
何なのか、何ができるのか、良くわからないままに注文しました。

ハードウェア側で、映像に対する推論までを終わらせるのだろう、、、という程度の知識です。

せっかく届いたので、なんなのか、確認してみます。

OAK-1

画像から判断するに、、、

  • 最大 60fps
  • H.265 フォーマットにおいては30fps 固定?
  • 解像度は 4056 x 3040 px
  • オートフォーカスは 8cm ~ 無限遠
  • F値 は 2.0

ということらしい。

OAK-D

画像から判断するに、、、

  • ステレオカメラ
  • 最大 120fps
  • 解像度は 1280 x 800 ピクセル
  • フォーカスは固定で 19.6cm ~ 無限遠
  • F値は 2.2

とのこと。

ステレオカメラで何ができるのでしょうか?
深度でも計測するのでしょうか?

FPSも凄いですが、何に活かすのでしょうか?

機能

画像から判断!

OAK-1, OAK-D 共通の機能

Neural Inference

Object detection, image classification, semantic segmentation, pose estimation, etc.

Warp/Dewarp

Support for additional lenses for fish-eye applications.

魚眼レンズのサポートでしょうか。

Object Tracking

Up to 20 objects with unique IDs.

Apriltags

Structured navigation.

ARマーカーを色々できるのでしょうか。

H.264 and H.265 Encoding (HEVC, 1080P & 4K Video)

3.125MB/s (tiny bandwidth) for 4k video; A Pi Zero can record 4k/30fps with this.

Feature Tracking

Optical and Visual Inertial Navigation.

JPEG Encoding

12MP Stills

Motion Estimation

Allows real-time background subtraction

MJPEG Encoding

For easy web streaming/etc.

Edge Detection Harris Filtering

OAK-1 固有の機能

Automatic motion-based lossless zooming
  • 12x lossless zoom with 720p output
  • 6x lossless zoom with 1080p output
  • 1.5x lossless zoom with 4k output

OAK-D 固有の機能

Stereo Depth (Including Median Filtering)

Extended disparity and subpixel possible for wider dynamic range

やはり、深度を計測できるようです。

3D Object Localization

Monocular AI with Stereo Disparity Depth
Stereo AI (i.e. stereo neural inference) for small object/feature support

Object tracking in 3D space

3D Trajectory in Real-Time
Enables motion statistics in meters

ドキュメントは?

とりあえず、ここを読めば良さそう。

https://docs.luxonis.com/en/latest/