【G検定対策】JDLAジェネラリスト検定2020~【過去問、難易度、感想】

【G検定対策】JDLAジェネラリスト検定【難易度、感想】G検定
スポンサーリンク

はじめに

2020年3月14日に実施された日本ディープラーニング協会ジェネラリスト検定(通称:G検定)に無事合格。
よって、どのように勉強したのかとか感想を記載する。
さらに実際の出題数、難易度等をシラバス単位で解説。
シラバス単位の出題数は、試験当日に走り書きした雑なメモから思い出しながら書き出したので、おおよその値となる。

今後のG検定受験者の役に立てれば幸い。
一応、試験前に作ったノートも貼っている。
使用禁止されているが、カンニングペーパーにもならなくはない・・・。

2020#2,#3,2021#1,#2の情報を随時追記する。

尚、文字数/画像数が多いためかページが重くなったので4ページに分割した。

スポンサーリンク

G検定の評判について

※ 読み飛ばし推奨!!

上司&同僚&部下からは特に不評なことは出てきてないが、SNS上では結構酷評されてる。
G検定のGはゴキ〇リのGだ!!
とか。
(気持ちは分からなくもない。一般的な試験だと問題集だけで対策としては十分なのだが、
 G検定に関してはその経験が結構邪魔をする・・・。)

ゴキ〇リを舐めていけない。
擬人化すると結構かわいいのだ。

身構えるゴキ〇リ

空飛ぶゴキ〇リ

Gデザイン案

ちゃんとデザイン案もある。(すごい。)

※画像は以下のサイトより拝借致しました。

スポンサーリンク

過去問っぽい問題集(仮)

勝手に過去問っぽい問題集作成中。実際の問題よりかは難易度低め。
※ 問題の種類は法規/近年の動向にかなり寄せてる。普通の問題を解きたい方は既存お問題集や模試サイトをやった方が良い。実際のG検定を受けた際に時事問題、法規問題に直面した際にショックを受ける方が多いようなので、そのショックをいくらか軽減する目的で設置。
公式テキストや問題集に載ってないような文言が出てくるが、AI白書arXiv等の文献で出てくるような言い回しを採用しているため。
G検定で求めれるジェネラリストとしては、割と必要と判断しても良い表現だと思う。
(G検定問題文も全てではないが、4割くらいはそんな感じ)

尚、初見では誤答する方が普通
パッと見わからないのであれば、Google検索してみるのもアリ。
重要なのは、「問題文と答えの関係性だけを暗記する」のだけは避けるべき
言い回しの違い知ってるはずなのに解けない現象が発生する。
あと、問題文より選択肢側に罠が仕掛けられていることもしばしば。
※これは、他の問題集を解くときも一緒。

※ 現在350問程放り込んでる。(新しいネタが見つかり次第随時追加中)


https://arxiv.org/

arXiv.org e-Print archive

AI白書。(用語検索を考えるとkindle版の方が良いかも)


arXivに上がっているような論文を読む際は、

  • Introduction(導入文)
  • Related Work(関連研究)

のような章がある。
特にRelated Work(関連研究)過去の経緯などが記載されており、そのくだりがG検定等の問題の表現に近いことがある。

私の所感だが、どうもG検定で求めているスキルのラインはarXivの論文がそこそこ読めるあたりに引いているように感じる。

他ブログやTwitter上でG検定に対して否定的な意見もそこそこあるが、それはそれでその方々の主観/意見であるので否定する気は無い
しかし、それに引きずられて他人の意見を鵜呑みにして、自身の意見としてしまう前に、今の世の中を見て、何を求めれているのか、どうあれば胸を張ってジェネラリストと言えるのか、という点を一考した方が良いだろう。

スポンサーリンク

arXivを利用した情報収集方法例

「Occlusion Handling in Generic Object Detection: A Review」
を例に挙げる。

arXiv、Occlusion Handling in Generic Object Detection: A Review、一般的なオブジェクト検出におけるオクルージョン処理:レビュー、PDF、Download

左上からPDFの論文がDownloadできる。

この論文のIntroductionの一部を抜粋。

Object detectors are categorized into two types: one-stage detectors, and two-stage detectors. The latter uses region proposal network to produce regions of interest (ROI) and apply a deep neural network to classify each proposal into class categories. The first type, however, considers the object detection as a regression problem, hence it uses a unified framework to learn the class probabilities and coordinates of bounding boxes. This makes one-stage detectors faster compared to its counterpart. The most effective state-of-art detectors are Faster RCNN, SSD and YOLO.

Occlusion Handling in Generic Object Detection: A Review https://arxiv.org/abs/2101.08845

↓日本語訳

物体検出器は、1段階検出器と2段階検出器の2種類に分類される。
後者は、領域提案ネットワークを用いて関心領域(ROI)を生成し、ディープニューラルネットワークを用いて各提案をクラスカテゴリに分類する。
一方、1段階検出器は、物体検出を回帰問題として捉え、クラス確率とバウンディングボックスの座標を統一的なフレームワークで学習する。
これにより、1段階検出器は、他のタイプの検出器よりも高速になる。
最先端の検出器としては,Faster RCNN、SSD、YOLOなどが挙げられる。

これだけで、物体検出器のおおよその分類/性格/関係性が見て取れる。
何となく単語だけで覚えるよりも、はるかに効率的に学習が進むと思われる。
(※G検定対策に特化した場合は、当然非効率にはなるが・・・)

スポンサーリンク

その他のAI関連記事

LSTMを使用した日経平均株価の予測の記事もかいてるので、興味ある方はこちらからどうぞ。

スポンサーリンク

G検定2020#2について

本記事を「見ておいてよかった。」「先にこの記事を見つけていれば。」等のコメントを頂いていることから、2020#2に対しても一定の効果はあったもの思われる。

スポンサーリンク

G検定2020#3について

#1,#2と同様に法規、近年の動向に難易度がよっているのは同様。

スポンサーリンク

G検定2021#1について

出題傾向としてはG検定2020#3を酷似したいた様子。
事前にいろいろ調査した方々は比較的に楽に解くことができ、そうでない人は恒例のテキスト、問題集とのギャップにやられたしまったという2極化が起きている。

スポンサーリンク

G検定2021#2について

この回より、おおよその獲得点数がわかるらしい。
日本ディープラーニング協会 事務局のメールを引用。

G検定の合格発表はこれまで合格/不合格しか開示しておりませんでしたが、今回より、個人ごとの分野別得点率と受験者全体の分野別平均得点率を開示することといたしました。また、不合格だった場合の合格得点率までのおおよそのポイント差も開示致します。開示情報が増えることにより、皆様の継続的な学びのサポートができれば幸いです。是非この機会にチャレンジしてください。

日本ディープラーニング協会 事務局のメールから抜粋

出題傾向は2021#1にかなり近かった様子。

個の回も事前にどれだけ情報収集できていたからで獲得点数が変わりそう。

スポンサーリンク

G検定を受けてみた感想

まずは大まかな感想。

  • ネット上の情報から感じた難易度よりも難しかった
    • 一応、年々難易度が上がっているという情報もあったので過去問、問題集だけでは対応できないとは思っていた。
  • 公式テキスト、問題集等から得られる基礎的な知識だけでなく、現時点の新しい知識も求められる
    • 強化学習あたりがテキスト、問題集ではあまり語られていない反面、出題数が多い印象
    • 自然言語処理関連も予想よりも多い印象
      • 2019年に流行ったBERT/transformerの影響?
    • 法規関連が最初の方に大量に出てきて心を折れかけさせた
      • 個人情報保護、匿名加工、自動運転。著作権、ドローン飛行規制、道路交通法改正(2020#2ではドローン関連問題は出なかったもよう。)
        (2020#3ではXAI、営業秘密に関連する問題が増加)
      • 以下3要件がある。
        • 秘密管理性
        • 有用性
        • 非公知性
  • ちょっと意外な問題
    • 三平方(ピタゴラス)の定理が出た。
      • 確かにベクトルのノルムを算出する時には使うのでAIと無関係ということは無い。
  • 出題数は214問/120分
    • 1問あたり33.6秒程度、10問あたり5.6分、50問あたり28分
      • よって、50問を20分で解くくらいのペース配分にして、分からないものは一旦切り捨てて後でググる
    • 2020#2は200問/120分と問題数が減った。
      • その分、難易度が上がったと思われる。
    • 2020#3は191問/120分
    • 2021#1も191問120分
    • 2021#2も191問120分
      • 2020#3,2021#1,#2は問題数、問題傾向共に似ている。ちょっと落ち着いてきたか?
  • 問題集を解きまくって反射的に答えを出すと言いう過学習方式は通用しない
    • 意図的に読んで頭にイメージを浮かべないと何を言っているのかわからない問題文になっている。
    • 対策
      • 既知の問題文を自分でドロップアウトさせて量産。それを持って自分の脳の汎化性能を引き上げておくと良い。
  • Google検索用にマルチモニタ推奨。
    • 可能であれば3画面で臨めると吉。
    • Firefoxとchromeの両方のブラウザを入れて、片方をG検定用、もう片方を検索用。という使い分けもあり。
スポンサーリンク

G検定(JDLA ディープラーニング ジェネラリスト検定)とは何か?

G検定(JDLA ディープラーニング ジェネラリスト検定)試験概要
私が説明するより、「日本ディープラーニング協会」のwebサイトを直接参照した方が良いでしょう。

資格試験について
当協会の実施する、資格試験について

一言でいうならば、

ディープラーニングの基礎知識を有し、適切な活用方針を決定して、事業活用する能力や知識を有しているかを検定する。

というもの。

  • 基礎知識を有する。
  • 活動方針を決定できる。
  • 事業活用できる。

こういった人材を指してジェネラリトと呼ぶ。

スポンサーリンク

G検定の過去も含めた合格率と難易度

開催日申込者数受験者数合格者数合格率
20171,5001,44882356.87%
2018#12,0471,9881,13657.14%
2018#22,7452,6801,74064.93%
2019#13,5413,4362,50072.76%
2019#25,3875.1433.67271.40%
JDLA の公開情報より


これに対して、2020#1は以下になる。

開催日申込者数受験者数合格者数合格率
2020#16,2984,19866.66%
G検定2020#1の合格通知より


合格率は見事に6が並んで・・・。(獣の数字?)
2019年が70%オーバーに対して、2020#1は66.66%と、やや難易度が高めと言える数値になっている。

3人の内2人が合格ということで、普通であれば難易度低めということになるが、受験者としては結構対策している人が多い気がするので、結構そぎ落とされてる印象にはなる。

合格点は公表されていないので、恐らくは合格率の調整が入っていると思われる。
よって、如何に平均より上に行くかが重要と考えて良い。

2020#2も似たような調整になると思う。なった。

開催日申込者数受験者数合格者数合格率
2020#2?12,5528,65668.96%
同僚のG検定2020#2の合格通知より

どうも200問解き終えなくても合格ラインには乗るようなので、テキストベースで落としてはいけない問題を落とさず、そこからの深堀&拡大が出来ていれば基本的にはOKと思われる。

開催日申込者数受験者数合格者数合格率
2020#3?7,2504,31859.56%
同僚のG検定2020#3の合格通知より

ここにきて、合格率が60%を切ってきた。
2020#2の合格発表後のTwitter上で
ほとんど解けてないのに合格した。意味あるのかこの検定
のような追及が多数有ったため、その影響なのか?

開催日申込者数受験者数合格者数合格率
2021#1?6,0623,86663.77%
同僚のG検定2021#1の合格通知より

再度、6割越え。
やはり、出題者側としては66.6%あたりを狙っていると思って良いだろう。

開催日申込者数受験者数合格者数合格率
2021#2?7,4504,58261.50%

ここ3回はおおよそ似た傾向と言える。
出題範囲、難易度といろいろ蛇行してきた検定だが、だいたい落ち着いてきたので、
今後は比較的対策しやすい検定となっていくのだと思う。

尚、本試験を受けた同僚/部下の合格通知は以下。
(そのままの数字を載せるのはアレなので若干弄ってる。)

■合否結果
=================
 【 合 格 】
=================

総受験者数 7,450名
合格者数 4,582名

■シラバス分野別得点率(小数点以下切り捨て)
1.人工知能とは.人工知能をめぐる動向.人工知能分野の問題:70%
2.機械学習の具体的手法:65%
3.ディープラーニングの概要:72%
4.ディープラーニングの手法:60%
5.ディープラーニングの社会実装に向けて:72%
6.数理・統計:45%
※総合得点率、設問個別の正解・不正解、本試験の合格ライン等は開示しておりません。あらかじめご承知おきください。

合格した中で一番獲得率の低いものをベースにしている。
何を言いたいかというと、6割取れていれば一応合格圏内と言える。

■合否結果
=================
【 不 合  格 】
=================

■あなたの合格正答率までのおおよそのポイント差
=================
【 A 】
=================

総受験者数 7,450名
合格者数 4,582名

【区分】[A:0%~10%]、[B:11%~20%]、[C:21%~50%]、[D:51%以上]
※合格ライン到達まであと何問程度正当する必要があったかを、問題セット全体に対する割合で表したものとなります。

■シラバス分野別得点率(小数点以下切り捨て)
1.人工知能とは.人工知能をめぐる動向.人工知能分野の問題:51%
2.機械学習の具体的手法:59%
3.ディープラーニングの概要:55%
4.ディープラーニングの手法:57%
5.ディープラーニングの社会実装に向けて:50%
6.数理・統計:39%
※総合得点率、設問個別の正解・不正解、本試験の合格ライン等は開示しておりません。あらかじめご承知おきください。

こちらは落ちた中で最も獲得率が高いパターン。
正答率5割ではやはり危険域ということになる。

スポンサーリンク

G検定は文系でも合格可能か?

良く聞かれる質問ではある。
結論としては文系、理系はあまり関係ないので十分可能

理由は以下。

  • 数学的解釈が必要な項目は少ない。
    • 2,3問あるかないか
  • どちらかというと歴史や法規に紐づく問題が多い。

言い回しが理系的なだけであって、
実際の内容は歴史、法規の性質が強いため、
実は文系の方が向いているような気がする。

私個人としては
「文系でも受かるG検定」というよりも、
「理系でも受かるG検定」という書籍の方が必要なのでは?
と思ったりする。
※ 当然インパクトの無いタイトルなので売れないでしょうが。

スポンサーリンク

G検定を受けるモチベーション

人によっては目的が無いと頑張れない人いるかと思う。
私もその一人であり、G検定を受ける上のモチベーションありき。

ちなみに私の「G検定を受けるモチベーション」は、
AI関連の案件受ける際のコミュニケーションに必要な知識の獲得。

昨今のAIブームに乗っかり、個人的に既存のアルゴリズムを試したりはしてるが、
全体像を把握しているわけではない
これが災いしてか、ちょっとしたAI、機械学習の用語が拾えないということもシバシバ。

そもそも言葉を知らないとか、成り立ちを知らないというのが、
結構案件獲得に対して印象を悪くしていた。

これを払拭するために、G検定を受験することを決めた。

つまり、「AI関連知識の全体像と基礎を押さえたい」という部分になる。

これ以外にも様々なモチベーションは考えられる。

  • AI関連技術者になるための基礎知識を身に着けたい。
  • AI関連事業を興したい。
  • 自社の作業効率化にAIを導入したい。

etc

スポンサーリンク

G検定対策前の私のスペック

  • 趣味でDNNを少しかじってる。
    • 「ディープラーニングの概要」の8割程度の知識
    • 「ディープラーニングの手法」の5割程度の知識
    • 「ディープラーニングの研究分野」の4割程度の知識
  • 上記の絡んでニューラルネットワーク以外の機械学習も知識レベルで少し保有
    • 「機械学習の具体的手法」の3割程度の知識
  • 微分積分、ベクトル、行列に対しては特に抵抗感は無い。

つまり、素の状態では214問中60問程度で正答率28%程度だったと言える。
これが知識ゼロからスタートする方と比較した際の私のアドバンテージとなる。

微分積分、ベクトル、行列に関して。

問題としてはそれぞれ1問出るか出ないか程度なので、この部分ではアドバンテージはなし

スポンサーリンク

G検定対策の学習時間

G検定に向けての対策は試験日から2週間前から開始。
一日の学習時間は通勤時間の学習も合わせて2時間程度
つまり、28時間の学習時間となる。

しかし、正直28時間では不足だったと認識している。
下で紹介している白本、黒本、AI白書をじっくりやって1周しかできず、正直言って知識として定着したかはあやしい。
よって、私と同様に一日に2時間程度しか学習時間を割り当てられない方は試験日1ヶ月前から学習開始して白本、黒本、AI白書を2周した方が良い

スポンサーリンク

G検定対策として学習に使用した本(テキスト、問題集、時事)

いわゆる白本黒本。加えてAI白書
私の場合は白本側でガッチリと全体像を捕まえて黒本とAI白書で随時補強していく方針で実施。
正直、白本だけでは今回のG検定の問題の半分も解けない
黒本加えれば半分は解けそう
AI白書の補強分でやっと6割越えだったかと。

ディープラーニングG検定公式テキスト(通称白本)

白本の第2版が出版されたもよう。(2021年5月11日)
当然、こちらで学習した方が良いだろう。
差分としては、Self-Attention、Transformer、BERT、GPTの明確に追加されていた。


徹底攻略 ディープラーニングG検定 ジェネラリスト問題集(通称黒本)


こちらも第2版が出版されたようす。
新しい方が良いだろう。


AI白書
試験中に検索することを想定するとKindle版の方が良いかも。


あと、松尾 豊 先生の「人工知能は人間を超えるか ディープラーニングの先にあるもの」は読んでおいた方が良い。
白本と被る内容は多いが、シナリオとして認識する文系脳の方は相性が良いかと。


短時間でさらっと勘所を捕まえたい場合ははマンガで読むのもあり。


私は持ってないが、AIカルタで学習というのも、取っ掛かりとしては面白いかもしれない。
(G検定頻出ワードを多数収録。JDLA推薦商品。って書いてあった。)

あと、たまたま本屋で立ち読みした本だが、以下などは比較的昨今のG検定の内容を踏襲しているように見受けられた。
BERT/transformer、XAI(Explainable AI:説明可能なAI)についても触れらていたので、今後のG検定の対策としては有効と思われる。


G検定2021#1に於いて8割方網羅されてたと言われる
「最短突破 ディープラーニングG検定(ジェネラリスト) 問題集」
だから大丈夫。とはならないあたりが厄介ではあるが。


スポンサーリンク

学習のコツ(出題者側の思考)

出題者側の思考を考えてみるのが手っ取り早い。
出題者に課せられた重大ミッションはおおよそ以下になる。

  • 合格点はおおよそ〷点にしたい。(たとえば60点)
  • 勉強していない受験者を即行で切りたい。
  • 上記に伴い、合否を二極化(または三極化)したい。

この場合、60点を取らせるためには、過去の問題や巷に流れている問題集から出題用の問題を持ってくる。
つまり、「この問題解いた事ある!ラッキー」ではなく、
「ヤバイ。出題者に解かされている!この問題は絶対落とせない」と考えるべきとなる。
これがほとんど解けない場合は、不合格確定。

次に二極化についてだが、
勉強してきた受験者の傾向も2つに分かれる。

  • 問題集をベースに慣らしてきた。(たぶん、8割の人間はこっち)
  • 情報を構造化して知識として定着してきた。(のこり2割はこっち)

G検定の場合、合格率66%を狙っているようなので、
前者の半分くらいを合格させる難易度に設定してくる。

つまり、問題集等で語られてはいるが、ちょっと論点、視点をずらす問題を散りばめてくることが予想できる。
これも半分は解けるようにしておかないと少し危険域に入る。

このような受験者の分布を散らしたいという出題者側の思考には注意しておいた方が良い。
合格ライン上で団子状態になるのは、出題者側からすると確実にさけたいはずなので。

そもそもとして、後者の「知識として定着」であれば全く問題は無い。

次に無料模試や無料講座によるG検定対策について

コメント

  1. OnlyFans Hack より:

    It’s hard to find educated people about this subject, however, you seem like you know what you’re talking about!
    Thanks

タイトルとURLをコピーしました