昨日の日記。 せっかく貫徹超えて、朝の9時からスタンバって学生を待ち構えていたのに、急に欠席した学生がいたので出番は午後からになった。 眠いけどやることいっぱいあるから寝れない。 徹夜で講義準備…てのはちょっと報われないな気がしてきた。 まあほかのプロジェクトとも関係のある部品(VirtoolsのBuilding Block)の開発がかかわっていたからいいんだけど…。 まあそれはそうと、何をやるかと言うと、「コンピュータビジョンの初歩」。演習なので学生のスキルを見ながら3時間で終わるように設計しなければならない。特に去年はHLSLを用いた無コンパイル、ピクセルシェーダー(コンピュータビジョン)コーディングだったのだけど、今年は要求スキルをぐっと控えめにして、さらに環境をOpenCVに中心した(スキルがある学生にはGPUVisionもつかうけど)。まあ甘目にはなるんだけど、面白さを知ってから勉強するのも悪くなかろう。OpenCVも十分おくが深い世界だしな。まあ初回組というのは「人柱」だし。 ちなみに今回の講義は資料は英語だけど、説明は完全にフランス語で行った。まあ外人講師だけどね、これぐらいは。 以下資料の抜粋。 TP n° 6 : Computer Vision But du TP : Understand a basic of computer vision (CV) to create a new human interface. Questions theoriques : 1. How to calculate FOV and resolution of detection with actual camera setup? 2. What kinds of techniques do exist for human motion detection? 3. What are the characteristics, advantage and weak points of computer vision? Ce qu’il faut savoir : Try to use several types of cameras like Digital Video Cam, Webcam, IEEE1394 industrial camera, etc… Measure view of camera and calculate FOV (Field of View) with arc tangent function. Download and test open source software project like OpenCV and GPUVision and try to use SVN (Subversion) to know how to share the source codes. Compare some techniques of computer vision then understand its differences. Finally, try to make a small application on Virtools with Virtools to learn how to innovate a new interface with CV. Realisation Pratique : 1. Setup given DV camera or Webcam by yourself with tripod then connect to Windows. Try to change all of configuration on camera or control panel like exposure, shutter speed, resolution, anti-flicker, auto mode, etc… Fix the camera and measure width and height of image on a plane then calculate FOV and resolution (degree of view, mm / pixel). 2. Install (copy) OpenCV and checkout GPUVision via TortoiseSVN then try some samples. Especially try human motion recognition with some applications. 3. Try to modify source code and connect to Virtools to make a new application. Ce qu’il faut utiliser : § Le dossier TP4, 6 et document supplementates. § Webcam, DV , driver, scale § OpenCV, http://www.intel.com/technology/computing/opencv/ § TortoiseSVN, http://tortoisesvn.tigris.org/ § GPUVision, svn://projects.shirai.as/home/svn/GPUVision § Virtools and GPUVisionBB (it is included in GPUVision) § AceSpeeder2 face recognition version Remarques : § Un rapport sur le TP devra etre remis a la fin de la seance. Si possible, en Anglais. o Camera type number and its FOV (degree for width and height) o Resolution at 320x240 (mm/pixel for width and height) o Report for human motion detection techniques o How much FOV, resolution and frequency do you need for human interface? o Other found discoveries and about new application on Virtools o Idea for a new human interface using computer vision 簡単に言うと、いろんなカメラ(DV,IEEE1394,Webcam)を用意して、PCにつないでみたり、という基本的な作業から、今度は電卓とメジャーをもって画角と解像度の計算をやってみる。さらにOpenCVやGPUVisionをTortoiseSVNなどを使って入手して、いろんなサンプルを試してみる。時間がある学生はAceSpeeder2の顔入力バージョンなども遊んでみたり、Virtools上で特製のBuildingBlockを使って何か作ってみたりして、「どんなインタフェース、アプリケーションが作れるかな?」と考えさせる課題。