とある社会人ドクターのブログ

研究や読んだ書籍等の話をします

土木学会論文集LaTexテンプレートをOverleaf対応させた

概要

Takuya Miyashitaさんのブログで公開されている土木学会論文集LaTexファイルをOverleaf対応させました。
作成したテンプレートはGitHubリポジトリに置きます。

使い方

  1. Overleafにアップロード
  2. プロジェクトのメニューからコンパイラLaTexに変更
  3. コンパイルを押すとプレビューが表示されます。

ACM SIGSPATIAL 2020に参加した

3行まとめ

  • 事前録画提出のオーラル発表をした.
  • バーチャル開催なのでZOOMで発表を聞き,質問や運営からの連絡等をslackで行い,懇親会をgatherで行った.
  • バーチャルは虚無度が高い

ACM SIGSPATIALとは

開催概要

  • 日程
    2020/11/03 - 2020/11/06
  • 場所
    Seattle, Washington, USA => バーチャル
  • 人数
  • サブミッション
    • アブストラクト 250 本(そのうち198本が条件を満たしていた)
      • 去年は218
    • 査読

      • 3人のレビュワー+1人のメタレビュワー
      • リサーチペーパーの採択率は33/149 = 22.1%
    • 採択論文の統計


      • 多い順に,US, Japan, China
      • テーマ
        多い順に,マイニング,空間・時系列データ解析,ビッグデータ,深層学習
      • キーワード
        多い順に,ロードネットワーク,ニューラルネット,深層学習,空間データ

バーチャル開催

slack

slackで運営からの情報が発信される.
各発表のQ&Aなどもセッションごとに切られたチャンネルで行われる.(実際に議論が行われたとは言っていない)

ZOOM

オーラルの他,ポスタ発表も短いプレゼン形式での口頭発表が行われる.その際に使用したのがウェビナーモードのZOOMである. オーラル採択だったので、私は12分のプレゼン動画を先に提出した。当日は録画した動画を運営が流して、その後質疑が行われる。ZOOMの機能で質疑を聴講者から受け付けられるのでそれをchairmanが読み上げることもした。

gather

懇親会やスポンサーブースはgatherというサービスを使用した.

f:id:shnhrtkyk:20201109093233p:plain
gatherの画面

感想

バーチャルだと質問や懇親会での情報収集があまり行われず,虚無が深かった.

Googleの音声合成(TTS)で国際会議の口頭発表を乗り切る

概要

  • Googleの音声合成機能を用いて仮の英語原稿を読む音声を作成
  • 音声合成した結果を聞いて時間間隔を測る
  • 合成した音声を仮に動画へはめ込んで全体のバランスを見る

Google text to speech(TTS)とは

Google音声合成機能であるText-to-Speechはテキストを入力すると,そのテキストをWaveNet等の機械が音読してくれるGCPの機能のひとつである.

Text-to-Speechはデモが簡単に体験できます.

以下の文章を音声合成してみます.

“Today I am going to talk to you about how we can do this. My presentation will be in three parts. Firstly I am going to look at the market and the background. Then I am going to talk to you about our new products and how they fit in. Finally, I’m going to examine some selling strategies that will help us increase our sales by 20%. The presentation will probably take around 20 minutes. There will be time for questions at the end of my talk."

f:id:shnhrtkyk:20201009192418p:plain
デモ画面

*デフォルトの Wavenet

これは私が読むには速すぎます.

*速度を落とした Wavenet

この速度ならば私でも読めそうです.

  • 非Wavenet

ちなみにWavenetではない結果は若干違和感があります.

発表原稿作成

上記のTTS機能を用いて発表原稿を音声に変換していきます. 日本語でスライドを作る感覚はあてにならず,持ち時間ぴったりのつもりでスライドと原稿を作成すると大きく時間がずれてしまいます.発表原稿をTTSに喋らせながらスライド1枚あたりの時間を計測していきます.

プレゼン動画作成

ある程度原稿が固まったら,発表動画に入れ込んでいきます.全体の持ち時間と各セクションのバランス等は通してみないとわからないので実際に並べてみると話し足りない箇所や聞いて理解できない箇所が見えています.そこを原稿修正し,最終盤ができたら音声合成の結果を参考に自分で発表原稿を読んで録音します.

2020年度前半に買った本

数学

  • 数理科学 2020年 07 月号
  • はじめての確率論
  • はじめての最適化
  • 応用のための積分幾何学 -図形の測度:道路網・市街地・施設配置
  • 大学数学スポットライト・シリーズ4 多様体への道

仕事論

  • 新 企業の研究者をめざす皆さんへ
  • カイゼン・ジャーニー たった1人からはじめて、「越境」するチームをつくるまで
  • Learn or Die 死ぬ気で学べ プリファードネットワークスの挑戦

ACM SIGSPATIALのオーラル採択

概要

空間情報分野の難関国際会議(ACM SIGSPATIAL)へ投稿し採択されました.年度のはじめにCVPRのワークショップにリジェクトされたネタをブラッシュアップしてACM SIGSPATIALに投稿し採択されました.

CVPR WSリジェクト後

CVPRのワークショップの際には,既存手法に対してセンサの生データを扱えるように変えて適用しただけに止まりました.それだけでは査読者らから総ツッコミを受け,散々な目にあったので,センサの特性に合わせた手法を新たに提案し,ベンチマーク検証でもハイスコア を示せるようにしました.

執筆

原稿の大枠はリジェクトされたCVPRの文章を使いまわせたので,あまり苦労をかけずに文章はかけました.投稿直前にジャーナルの査読があり,その対応と同時に執筆するのが辛かったですが,ジャーナルの査読者が指摘した専門用語の使い方に関して先に対策できたのでよかったです.

査読->リバッタル->採択

査読者からの意見が出て,「Strong accept, Weak accept, Accept」とのことで基本的には査読者の意見に従い誤字の訂正・図の修正がメインでした.しかし,査読者からのWeak Pointの指摘は完全に正しく急所を捉えていたので,今後の課題である旨を正直に返答しました.課題を強めに指摘されましたが,全体総括で客観的な提案手法の強みを述べてくれているのがありがたかったです.リバッタル期間が終わり,最終決定が下り,無事に採択されメタレビュワーからの

The paper is a straight accept, which is a remarkable achievement for sure given our low accept rates.

というコメントは励みになりました.

ジャーナル採択

概要

2019年12月に開催された国際会議で発表したネタを元に発展させた研究がジャーナルに採択されました. 国際会議終了後から採択までを記録として残しておきます.

国際会議終了後の実験期間

国際会議で議論した内容を踏まえて,年末の会社が休みの期間中に実験を行いました.帰省中でもTSUBAME上にデータを置き,計算もTSUBAMEを用いたため,どこでも実験できる環境を構築したのは正解でした. この際,ジャーナル向けの実験とCVPRのワークショップ向けの実験を並行して行っており,結構きつかった思い出があります.

執筆期間

提案手法の検証実験を行った結果を元に執筆を開始しました.3月にCVPRのワークショップがあり,ジャーナルの原稿と並行して書く作業になりました. 執筆環境がワークショップがOverleafを用いたLatexで,ジャーナルの方がword環境で切り替えに苦労した記憶があります. ワークショップの締め切り後にある程度骨組みを書いていたジャーナル原稿を一気に仕上げ投稿しました.

査読対応

査読者からの意見が結構厳しめではありましたが,概ね肯定的で助かりました.主なツッコミが専門用語の誤用をしてしまったため,余計な誤解を査読者に与えてしまったことの誤解を解く作業が大きかったです.投稿先の文化によっては,どの章に何を書くかがマナーとして決まっており,それに合わせる必要のあるとのことでした.

採択

査読者とのやりとりが終わり,無事採択され6月に公開されました.

ECCV2020点群系リスト

  • ECCV EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection. [code][Detection]
  • [ECCV] 3D-CVF: Generating Joint Camera and LiDAR Features Using Cross-View Spatial Feature Fusion for 3D Object Detection. [code][Detection]
  • [ECCV] GRNet: Gridding Residual Network for Dense Point Cloud Completion. [code][Completion]
  • [ECCV] A Closer Look at Local Aggregation Operators in Point Cloud Analysis. [pytorch/tensorflow][Analysis.]
  • [ECCV] Finding Your (3D) Center: 3D Object Detection Using a Learned Loss. [Detection.]
  • [ECCV] H3DNet: 3D Object Detection Using Hybrid Geometric Primitives. [pytorch][Detection.]
  • [ECCV] Quaternion Equivariant Capsule Networks for 3D Point Clouds. [Classification]
  • [ECCV] Intrinsic Point Cloud Interpolation via Dual Latent Space Navigation. [Interpolation]
  • [ECCV] PointPWC-Net: Cost Volume on Point Clouds for (Self-)Supervised Scene Flow Estimation. [Flow]
  • [ECCV] H3DNet: 3D Object Detection Using Hybrid Geometric Primitives. [pytorch][Detection.]
  • [ECCV] ParSeNet: A Parametric Surface Fitting Network for 3D Point Clouds. [Fitting]
  • [ECCV] Label-Efficient Learning on Point Clouds using Approximate Convex Decompositions. [code][Learning]
  • [ECCV] DPDist : Comparing Point Clouds Using Deep Point Cloud Distance. [Comparing]
  • [ECCV] SSN: Shape Signature Networks for Multi-class Object Detection from Point Clouds. [code][Detection]
  • [ECCV] PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling. [Upsampling]
  • [ECCV] AdvPC: Transferable Adversarial Perturbations on 3D Point Clouds. [Perturbations]
  • [ECCV] Learning Graph-Convolutional Representations for Point Cloud Denoising. [Denoising]
  • [ECCV] Detail Preserved Point Cloud Completion via Separated Feature Aggregation. [tensorflow][Completion]
  • [ECCV] Progressive Point Cloud Deconvolution Generation Network. [code][Generation]
  • [ECCV] JSENet: Joint Semantic Segmentation and Edge Detection Network for 3D Point Clouds. [code][Segmentation]
  • [ECCV] Shape Prior Deformation for Categorical 6D Object Pose and Size Estimation. [pytorch][Pose]
  • [ECCV] Mapping in a cycle: Sinkhorn regularized unsupervised learning for point cloud shapes. [Correspondence]
  • [ECCV] Pillar-based Object Detection for Autonomous Driving. [tensorflow][Detection]
  • [ECCV] DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF Relocalization. [pytorch][Localization]
  • [ECCV] Meshing Point Clouds with Predicted Intrinsic-Extrinsic Ratio Guidance. [Meshing]
  • [ECCV] Discrete Point Flow Networks for Efficient Point Cloud Generation. [Generation]
  • [ECCV] PointContrast: Unsupervised Pre-training for 3D Point Cloud Understanding. [Unsupervised,Understanding]
  • [ECCV] Points2Surf: Learning Implicit Surfaces from Point Cloud Patches. [Surfaces]
  • [ECCV] CAD-Deform: Deformable Fitting of CAD Models to 3D Scans. [Fitting]
  • [ECCV] Weakly Supervised 3D Object Detection from Lidar Point Cloud. [Detection]
  • [ECCV] Self-Prediction for Joint Instance and Semantic Segmentation of Point Clouds. [Segmentation]
  • [ECCV] Virtual Multi-view Fusion for 3D Semantic Segmentation. [Segmentation]
  • [ECCV] Searching Efficient 3D Architectures with Sparse Point-Voxel Convolution. [Segmentation]