だだもれ

2022年02月27日

24日、ロシアがウクライナに攻め込んだ。 驚いたり、悲しんだり、といった感情の動きはさほどないのだが、 こういうことが日本で起こったら自分はどうすればいいのか、 ということを考えてみても何も出てこない。 水も電気もガスも食料も、社会が平常運転していることに完全に依存している。 携帯ガスコンロや水くらいはあるが、ちょっとした災害ならともかく、 戦時ともなれば如何ともしがたい。

オタマが折った弓は復活した。4万円かかったけど、性能を損なわずに復活したのでめでたい。 オタマも多少は丁寧に扱うようになるだろう。 予備のカーボン弓も買って届いたし、まあ問題はない。

手書き算数ドリルアプリ、とりあえずシノンに使わせる分には実用になる所まで作った。 認識にクセがあるので人間が順応しないといけないし、 何も説明せずに使えるほど洗練されたUIにはなっていないが、 自家用ならとりあえず使える。 次はオトモに数字をなぞらせ、物を数えさせ、答えが一桁に収まる加算をさせる、 という段階に入る。

で、協力者を募ったり、感想をもらうために、 今の状態でベータ公開することにした。 最大1000人が落とせて、もし1000人がまともに使うと CloudVisionAPIの課金がえらいことになるが、 そんなことは起こるまい。おかしな課金額になりそうだったら即刻止める。

夏に障害者施設でチャルダシュ弾くことになりそうだ。 あれってムッチャムズくなかったっけ?と思っていたが、 単に達人が超アレンジした上に爆速で弾いてた印象が強かっただけで、 楽譜準拠でそれほど速度を上げなければ大して難しくもなかった。 しかし、楽譜通り弾くと曲芸度があまり高くない。 音楽というより曲芸であることを重視した方が良かろうと考えると、 少々難度が上がるような味付けをした方が良さそうに思える。 コード進行いじったり、ジャズ的に調から外れる装飾音をつけるのは趣味の問題があるし避けるが、 重音増やして音の刻みをいじるくらいはした方が良さそうだ。 もともと楽譜通り弾くような曲じゃない。

2022年02月06日

オタマが弓折った。オタマはバイオリン持ってるときに、なんか言われたりしてストレスかかると弓を 振り回したりなんかにぶつけたりしがちで、いつか壊すだろうなとは思っていた。 ああいうのは無意識なので、言っても直らない。壊さずに済めばそれでいいし、 壊したら壊したで、それをきっかけに悪いクセが直る可能性も出てくる。 カーボンファイバーの弓を持たせておけば38万円の弓を破壊せずに済んだだろうが、 カーボンファイバーは丈夫なので壊れず、オタマの悪いクセが直らない。 理想は子供用楽器のうちに破壊しておくことだったのだが、 運良く壊さずに来てしまったので仕方がない。

とりあえずカーボンファイバーのバイオリン弓を注文した。 ビオラ用に買った奴が良かったので、同じメーカーの同じグレードのバイオリン弓。 3万円くらい。アメリカ直輸入なので、 届くまでは以前買った5000円のグラスファイバー弓を使ってもらう。 ビオラ弓でも良ければカーボンファイバーがあるのだが、 重さを測ったら10gくらい違ったので、さすがに悪影響があるかもしれない。 私は全然気にならず、跳ねる奴もそこそこやれるのだが、 私が雑なだけでプロにとっては違うだろうし、子供の上達にも影響するかもしれない。 まあ、グラスファイバーの弓は見た目が木製に似せる気が全くない製品なので、 これはこれで先生に「なにこれ?」ってなる気はする。 次回の練習は私も同伴して説明しよう。

調べたら同じ壊れ方しても修理してる例があったので、 近くの工房の予約フォームに書いて送っておいた。 ダメならそのweb記事を書いてる楽器屋に相談かな。秋葉原で遠いから できれば近くの所で済ませたいのだけど。 にしても問題は費用だ。5万なら直すが、10万となると迷う。 完全に元の性能には戻らないだろうし、 修理しても結局カーボンファイバーを使うかもしれない。 すでに歪みが出てるし、剛性もカーボンファイバーには劣る。

教育アプリを作り始めた。 オトモとシノンに字を書かせるのに、鉛筆と紙ではしんどい。 とはいえ、何をどう作ればいいのかもわからんし、 技術的な問題がどこで出るかもわからないので、 仕様が簡単で技術課題に集中できる 計算ドリルを作ることにした。 手書きで数字を書きこむと、手書き認識で判定して、 正解なら次へ進む。文字だと書き順がどうとかの問題があってより高度だが、 数字ならそれほど面倒ではないはずだ。認識も難度が低いだろう。

で実際動くプロトタイプを作ったのだが、当初の目論見通りには行っていない。 まず、数字専用の認識ライブラリなんてものがまるで見当たらない。 書く過程も取れるので、ベクトルあるいは頂点列を入力する形式なら 高い認識率になるだろうと思ったのだが、 画像入力形式のものしか見当たらないのだ。 しかも認識率が高くない。webで試せる奴があったが、使い物にならなかった。 有名な数字のデータセットを使った奴で、機械学習のhello worldみたいなものだからだろう。 結局、googleのcloud vision APIを使ってやることにした。 数字1,2文字だけ書いて送ると悲惨な認識率だが、 画像の端に"0123456789 hello world" などと書いておくと、言語や向きの推定のヒントになるのか、大幅に認識率が増す。 さらにD,O,は0に、qやaは9に、iやlは1に解釈し直すなどすればかなり使える。 それでも11や9は若干怪しいのだが、そこは運用でカヴァーするしかないだろう。 このAPIを使えば将来的には文字も視野に入ってくるし、 それぞれの文字の位置がjsonで帰ってくるので、 筆算の計算過程全部を評価して、どこで間違ったかを教えてくれるソフトも作れるだろう。 というわけで、とりあえずはこれで行く。

にしても問題は、vision APIが有料なことだ。1000回叩く度に1.5ドルかかる。 1画ごとに画面撮影してAPIを叩いているので、 3桁の数字なら最大6回、もし将来筆算などを扱えば、 1問あたり10回以上APIを叩くことになる。 さすがにお値段が気になるだろう。 そして何よりも、このままストアに置いて不特定多数の人に公開してしまうと、 課金が全部こっちに来てしまう。 アプリを洗練させる上でも公開して意見を聞きたいし、 あわよくば他人にも開発に参加してほしいのだが、 ストアにタダで置けないとそれがかなり難しくなる。 将来どこかのタイミングで認識エンジンを内蔵のものにしたい。 そうでないと、課金アプリにせざるを得なくなる。


もどる