SSII day2
SSII2019 day2
プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~
マルチモーダル4Dセンシング ~リアルワールドのデジタル化~
セッション全体説明
- 空間モデリング
- 自動運転やARに必要
- 深層学習
- 普及
- マルチモーダル
弱点を補う
- LiDAR
- ステレオ画像
- 組み合わせてより密な情報を推定できる
形状以外の物理量を統合
- 3D温度マップ
- なぜ必要か
- 信頼性をあげる
ロボティクスにおけるSLAM手法と実用化例
- ロボットの自律移動にはセンサ融合が必要
- スキャンマッチングでもベイズ推定したい
- 推定位置の不確実性を求めたい
- 共分散を求めると不確実性がわかる
- レーザの受光強度を使う
- 通常のICPは形状だけだったので,平面だけだと位置合わせ失敗する
- 強度も使うと拘束されるので良い
- 自律ロボナビゲーション
- ルンバ的なやつ
3次元・マルチモーダル音環境認識
- 音環境認識
- 音イベントの「どこで」「どんな」を認識したい
- システム
- 収録された音を
- 音源分離
- 音源定位
- 認識
- 最終的にロボの行動計画をおこなう
- 収録された音を
- 難しいこと
- 観測音が混合されている
- 教師ありでは難しい
- 特定の音源は用意できるが自然音は取得難し
- 観測音が混合されている
- やりたいこと
- マルチモーダルで対応したい
- 深層学習
- 混合音分離
- ❌教師ありでは大量のデータが必要
- 学習データの問題を解決
- 音声と雑音分離(音声強調)
- 音声をVAEでモデル化
- ノイズを古典的確率モデル
- 画像と音の共起関係を学習(音源分離)
- 映像情報を学習するとどこから音が鳴ってるか推定できる
- 多チャンネル録音の空間モデル
- 近い遠いをモデル化
- 音イベント識別
- シーン分析など
- 音声認識において
- 人の唇のデータも同時に学習
- 音声と雑音分離(音声強調)
- 混合音分離
- OSS
- HARP
エンドユーザー向けSLAM技術の現在
- モバイルのAR
- 家具配置するアプリ
- 古典的に解いていたがARkit, ARcoerでスケール推定までできるようになった
- 手軽なAR体験,コンテンツ作成が研究要素として残った
- 家具配置するアプリ
- 気軽なAR体験
- ブラウザ上でARできるのは手軽
- コンテンツに依存する
- SoTAのWebAR
- 8th Wallのライブラリが良い
- WebSLAM
- クライアントサイドでは特徴点抽出
- サーバーサイドでは重いSLAM
- 密な三次元復元
- Depth推定するCNN
- メッシュ形式で3次元推定できる
- v-SLAMにCNN入れたやつもある
- Mesh CNN-SLAM
- 人物のオクルージョン対応できるようになった
- 点群から見えの変換をできる
SSII day1
SSII day1メモ
チュートリアル GAN
GANの研究例
GANの説明
- 概要
- 登場人物
- pdata
- 手持ちのデータのランダムサンプリング
- pz
- 人工的な分布
- N次元のガウス分布
- G
- zを入力にして,データを作成
- 出力がG(z)
- D
- G(z)の出力もしくはp_data
- pdata
- 学習概念
- G
- 判別平面を本物のデータに近づける
- D
- 判別平面を遠ざける
- G
- 登場人物
最適化
- 問題設定
- D
- 本物のデータが入った時D(x)=1のとき最大
- 偽物のデータが入った時D(x)=0
- G
- Dを騙す
- D
- 最適解の時
- 本物のデータと作られたデータの分布が一致するから
- 問題設定
なぜその最適化
解く時
- Gを固定
- Dの最大化を見る
- p_data/(p_data+p_g)の時に最大になる
- Gを学習
- 式を書き換えると,-log(4)+JS(p_data||p_g)になる
- p_data=p_gの時に最小
- 実際に解くとき
- minmaxは交互に解く
- まとめ
- loss関数のminmaxゲームを解く
- 最適な値の時,p_dataとp_gが一致する
- ??????
- ほんとに一致するの???
- Gを固定
数値実験
- まとめ
- GANは2つの分布を一致させるもの
- 数式で書けない分布も近似できる
- ナイーブに解くと失敗する
- 不安定さ
- モード崩壊
- 作られるデータの確率分布が偏る
- unwanted sample
- p_dataになさそうなデータができる
安定性
- p_dataになさそうなデータができる
- 問題点
- 高解像度の画像生成をやりたい
- mnistmですら不安定なのになんでできる?
- 安定化の手法研究とその組み合わせ
- 高解像度の画像生成をやりたい
- 手法
- TTUR
- Dの学習率を大きくする
- Zero-centreted gradient penralty
- 正則化項
- 欲しい分布の近くにいてほしい
- Spectral Norm.
- TTUR
- Spectral Norm.
- なにしたい
- Dの勾配を小さくしたい
- なんで?
- GANの問題点
- 勾配消失
- Dが強すぎて勾配消失
- 偽物を偽物と完全に見破ると勾配が消える
- Gのlossを勾配が大きくなるように式変形する
- 式変形したら勾配が大きくなりすぎるので不安定になる
- deltaD/Dが大きい
- deltaDを小さくして勾配を小さくしたい
- Spectral Norm.が提案される
- 手法
- NNの各層の重みはある範囲で抑えられる
- NNで出てくる活性化関数は大抵1-リプシッツ連続であるという仮定
- まとめ
- delta Dを小さくするためにspectral norm.提案
- 勾配消失
- なにしたい
モード崩壊,Unwanted sample
実験的な結果が多くてまだまだ研究途上
- モード崩壊
- 何?
- 生成データが偏る
- 何?
Unwanted samle
- 何?
- p_dataに無いデータも作られる
- 何?
モード崩壊とUnwanted sample問題は一緒では??
- Gに入れるノイズがシングルガウス分布なのが問題???
- 例えば,犬と馬の画像がガウシアンは非連結
- この場合,NNで近似したGは連続関数なので近似できない
- つながった近似
- 片方だけ近似
- Gに入れるノイズがシングルガウス分布なのが問題???
- 解決方法
- Bourgain Embedding
- N点のデータの距離を保ったままO(log(n))次元に埋め込む
- 距離はHxWxC次元のユークリッド距離
- Bourgain Embedding
- まとめ
- サンプリングするノイズの分布はきちんとしましょう
- 最良のp_zの作成方法は謎
- p_zがシングルガウス分布じゃない時の話は謎
ドメイン適応
- 2つの分布を一致させる手法なので
- 教師なしドメイン適応ができる
ドメイン適応とは
- オープンデータセットでモデル学習
- 別の似たデータでは精度が出ない
- つまり
- ラベル付けしたデータと実運用で環境が違う時にどうしようか
- やりたいこと
- 以下のデータで良いモデルを作りたい
- 手元のデータ
- 運用環境のデータ
- 以下のデータで良いモデルを作りたい
- オープンデータセットでモデル学習
よくある手法
- ドメイン間の特徴量空間を一致させる
- 分布一致すると,ソース側の分類器が使いまわせる
- 具体例
- ADDA
- 最近の研究
自動走行
話す内容
- 自己位置推定, SLAM
- 自動走行の課題と最新動向
自己位置推定,SLAM
- 自己位置推定
- 地図とセンサ観測をマッチング
- 地図は更新しない
SLAM
- 同時に自己位置推定と地図作成を行う
- 地図を更新する
なぜ必要
- 自動走行における処理の簡略化
- 自動運転用の地図作成にSLAM必要
- 歴史
最近の研究
- 深層学習とSLAMの融合
- モデルベース,機械学習の両方抑える必要がある
自動走行の課題
- 性能保証
- demoは多い
- 性能保証や緊急対策がむずかしい
- 推定結果の正しさも明示的に予測すべき
- ロバスト性の向上
- 性能保証
- ロバスト性の向上
- モデルの向上
- 対応点探索を不要に
- 画素をそのまま使って最適化
- モデルと深層学習の融合
- Sem.Seg.で画像のらベル推定できる
- 自己位置推定に必要な静的な地物のみを見るようにする
- Sem.Seg.で画像のらベル推定できる
- 信頼性
- 対応点の正しさを推定する
- 深層学習で自己位置推定結果の正誤を予測
- 全部深層学習でやってしまおう
- 反復って点群位置合わせ
- PointNetで点群マッチングを反復計算
点群
3次元点群とは
- x,y,zの点の集合である
- 画像との違い
- 順番がバラバラ
- 点群深層学習
- PointNet以降増えた
- 最近
- CVPR2019
- ICRA2019
点群深層学習
- むずい
- 順不同
- 剛体変換にロバスト
- スパース点群に対する畳み込み演算
- 順不同
- 点の順番が変わっても同じ形状
- PointNetの解決方法
- シンメトリック関数
- 点ごとに対する特徴変換は順番に依存しない
- Grobal Poolingならば順番に依存しない
- 点群全体から集約した特徴量
- シンメトリック関数
- 剛体変換不変性
- 同じ物体であるが,並進・回転が発生するが同じクラスとして予測したい
- PointNetの解決方法
- Spatial Transfomer Network導入
- 幾何変換のパラメータ推定
- 入力と特徴量空間で変換
- Spatial Transfomer Network導入
- スパースな点群の畳み込み
- Pointwise CNNのPointwise Conv
- 剛体変換には対応できん
Tangent Conv.
- 接平面に
Dynamic Graph CNN
- エッジごとに特徴量計算
- ノードごとにエッジの特徴量を集約
- Pointwise CNNのPointwise Conv