Music TO GO!

2023年07月29日

アスキーに「デジタルオーディオの裏方的存在、Stream Unlimited」の記事を執筆

アスキーに「デジタルオーディオの裏方的存在、Stream Unlimited」の記事を執筆しました。

https://ascii.jp/elem/000/004/143/4143494/
posted by ささき at 09:02 | TrackBack(0) | ○ PCオーディオ全般 | このブログの読者になる | 更新情報をチェックする

アスキーに「第2世代のSnapdragon Soundを、LE Audio採用で低遅延化」の記事を執筆しました

アスキーに「第2世代のSnapdragon Soundを、LE Audio採用で低遅延化」の記事を執筆しました。

https://ascii.jp/elem/000/004/142/4142448/
posted by ささき at 09:01 | TrackBack(0) | ○ ポータブルオーディオ全般 | このブログの読者になる | 更新情報をチェックする

2023年06月27日

R2R DACを搭載してアナログサウンドを追求した「A&Futura SE300」レビュー

SE300はAstell & Kernの実験的なラインナップであるA&Futuraの最新モデルです。
技術的にいうとSE300はR2R DACを搭載してA級AB級増幅切り替えを採用した点が特徴だけれども、音的にいうと従来のA&Kのプロサウンド基調の枠からは外れて、音楽的な美しさとか艶といった官能的要素を重視したDAPだという点が特徴です。ただ特筆すべきなのはSE300が単なる昔のマニアックDACの復刻ではなく、解像力とかSNの高さのような現代的性能の高さを兼ね備えているという点です。

IMG_6113_s.jpg

A&Futura SE300は6月17日に発売。直販価格はSE300が329,980円。 ケースは直販17,980円です。

IMG_5953_s.jpg
専用ケース(ブラック)を装着したSE300

* 特徴

1 ディスクリートR2R DACを搭載、NOS/OS切り替え機能

ここから少しSE300の基本として、まずR2RとかNOSとは何だ、なんのメリットがあるのかというところを説明します。

SE300 Audio Block.jpeg
SE300オーディオ回路

1-1 R2R DACとはなにか

オーディオのDACは分類すると、デルタシグマ形式DACと、R2R形式DACに分かれます。昔はそれぞれ1ビットDACとマルチビットDACと呼んでいたんですが、ESSのように6bitでデルタシグマ形式の中間形式のDACが出てくるとこの分類が怪しくなるので、アーキテクチャからデルタシグマ形式とR2R形式に分けています。
デルタシグマというのはDSDのようにデータの差分を信号とする方式で、R2R(Register to Register)またはラダー形式というのは抵抗を組み合わせてPCMのビット数に対応する方式です。つまりデルタシグマ形式のDACはDSD音源をデコードするのに向いていて、R2R形式はPCM音源をデコードするのに向いています。R2R形式は抵抗をはしごの様に組み合わせるのでラダーDACとも言われます。
しかし現在のほとんどの音源がまだPCMなのに対して、現在のほとんど全てのDACはデルタシグマ形式です。これはR2R形式の場合はビット数が高くなるほど精度を出すのが難しいから、高ビット数(24bitなど)に対応する設計を実現しやすくするためです。これがこれまでR2RディスクリートDACが敬遠され、DAC ICでも24bit精度を持つのがPCM1704のように限られていた理由の一つです。しかし最近ではDAC IC不足や技術進歩から再びこの形式が見直されています。
SE300では誤差0.01%の超精密抵抗器を48組、96個の抵抗を組み合わせてR2R形式をディスクリートで実装しています。少し前の据え置きのXI AudioのSagraDACで使用されたのはSOEKRIS社の特注の高精度で0.012%だったので、SE300ではかなり高精度の設計がなされているといえるでしょう。

基板.jpeg
SE300のR2R DAC部分

1-2 NOSとはなにか

まず、オーディオの世界でNOSという場合には真空管アンプでNOS(New Old Stock = 新古品)という場合とDAC設計でNOS(Non-Over Sampling = オーバーサンプリング無し)という場合があります。今回は後者についてです。

NOSがあるからにはOSがあります。OSとはオーバーサンプリングするということです。オーバーサンプリングとはDACの内部でサンプリング周波数を高くすることです。なぜオーバーサンプリング(OS)をするかというと、一つにはノイズを取りやすくするためです。
反面でNOSにするとOSでは除去されるはずの高周波成分が残って出力信号に混ざる可能性があります。それが情報が増えるという意味ですが、ノイズが残るので一般にSNが下がると言われます。
言い換えるとOSとはノイズを効率よく取るということであり、NOSとはそれをせずにダイレクトにDA変換するということです。つまり一長一短があります。

R2R方式はPCMをそのままデコードできるので、デジタル処理は最小限で済みます。先に書いたデルタシグマ型のDACは原理的にOSが必須となります。つまりNOSというオプションはありません。一方でR2RではOSは必須ではないのでNOSという設定が可能となります。そしてR2RではOSも可能です。つまりは両方切り替えられるのはR2Rの特徴です。
ですからR2RでもOSはできるけれども、最小限のデジタル処理で自然でアナログの音という観点から、デジタル処理がより少ないNOSがR2Rと組み合わせることが多いというわけです。R2R DACのことを別名でNOS DACとも呼ぶことがあるのはこのためです。

ちなみにこれはオーディオだけではありません。デジタルカメラをやっている人は「ローパスレス」という言葉をマニアがよく口にするのを聞くと思いますが、このローパスレスがオーディオで言うとNOSです。デジタルカメラで言うとローパスがある方が全体に画像はすっきりしますが、細部はぼやけています。ローパスを取るとモザイク状(偽色)になる部分がでますが、細部まで緻密に写ります。つまり入力をよりダイレクトに取り入れるという点ではオーディオにおけるNOSに似ています。
これをオーディオ的な言い方をすると、NOSはより情報量が多く自然でアナログに近いサウンド、OSはデジタル処理により高精度な再現性やノイズ低減を実現、となります。


2 A級/AB級増幅切り替え機能

A級増幅についてはPA10のところで書きましたが、SE300ではA級とAB級の切り替えができるようになりました。一般的に言うとA級はスムーズで電力消費が多く、AB級はよりパワフルで電力消費は少なくてすみます。SE300ではUIでA級増幅とAB級増幅を切り替えることができます。
電池容量はSP3000と同じ5000mAhもあり、SE200が3700mAhだったからかなり電力は消費してるように思います。

AMPモード.jpeg
アンプモード切り替え画面

さきに書いた様にNOSとOSではNOSがより味のある官能的な良さを志向して、OSのほうはSNの高さなど性能的な良さを志向しています。A級増幅とAB級増幅ではやはりA級増幅の方が味の良さを志向して、AB級増幅の方が性能的な良さを志向しています。
このNOS/OSとA/ABを組み合わせて自分の好みの音を作れるというのがSE300の特徴なわけです。そういう意味では二種類のDACを持つSE200やDACモジュール変更ができるSE180の延長線上にある音を変えられるDAPであるということもできます。

FPGA OS NOS.jpeg

SE300ではFPGAを搭載しているのも特徴の一つです。なにに使用しているのかはよく分かりませんが、推測としてはOSのさいのオーバーサンプリングとDSDをPCMに変換するのに使うのではないかと思います。

IMG_6190_s.jpg

* インプレッション

SE300は外観も特徴的で、片側側面が鏡面仕上げで波をうち、もう片側がマット仕上げというのもSE300の持つ2面性を表しています。見た目の高級感もあり、サイズ的にも操作感を考えると適当な大きさだと思う。

IMG_0932_filtered_s.jpg  IMG_0931_filtered_s.jpg

専用ケースはベジタブルタンニングレザーを採用しブラックとブルーがあります。ケースは手触りも良く、高価なDAPが滑りにくくなるので良いのですが、記事内の画像はSE300の特徴を見せるためにケースなしで撮っています。

IMG_0943_filtered_s.jpg  IMG_0946_filtered_s.jpg
専用ケースとケースを装着したSE300

さっそくその音をまずA級増幅でNOSで聴いてみます。
パッと一聴して今までと違う音だということがわかります。音が滑らかで柔らかく暖かみがあります。エージングしないでこんな滑らかなのは聞いたことがない、というかSP3000以来ですがSP3000とは違うタイプの滑らかさです。
中高域に独特の艶っぽさがあるのが昔懐かしいNOS DACの感じに似ている様にも思います。しかしながらSE300がそうしたノスタルジーの産物ではないということは、透明感や解像力の高さなどからわかります。味のあるマニアックな感じと現代的な性能の高さがブレンドされている感じです。
R2Rの音がイメージし難いというときは、普通のDACにおいてDSDを再生した時のDSDネイティブ再生とPCM変換の違いをイメージすれば近い様には思う。R2RはそれがPCMとDSDでは逆というわけです。

IMG_0942_filtered_s.jpg

SP2000Tのオペアンプモードと遜色ないほどの高い解像力と細かい音再現が感じられ、R2Rというとマニアックな味系の個性重視のように思えるんですが、SE300は解像力や音像の明瞭さもESSを思わせるくらいある。NOSってSNが理論上は低くなるけど、あまり濁りを感じないところはA&Kの低ノイズ設計が全体として効いているのかもしれない。
SP2000Tのオペアンプモードでは少し高域がきつい曲の部分では、まったくきつさを感じないのはR2R DACらしいところです。メタルを聴いていてもキツさが少ないので、長時間聴いていられますね。SP2000Tの場合には真空管モードを使って似た感じの効果を出すことはできます。

E99E186E-89CE-4D53-AACD-AA06C1C7E67C_1_105_c_s.jpg

SE300はとにかく音楽を美しく再生するDAPということが言えると思います。イヤフォンを変えるともちろん音は変わりますが、どれでも音楽を美しく聴かせてくれると思います。
でもやはり元のイヤフォンの音にも左右され、イヤフォンの音調がHIFIモニター的なものよりは音楽を楽しく聴かせてくれる系のイヤフォンの方が合っていると思います。例えばqdc Folkですが、最も合うのはDITA audioのPerpetuaだと思う。Perpetuaだと音楽の美しさと解像力の高さの両方を堪能できます。また一般的にマルチBAよりはダイナミック機の方が音の相性が良い様には思います。
Perpetuaと合わせると高域が艶やかで華やかに美しく響き、音の細部も拾い上げて情報量も豊か、かつ躍動感があって低音も深くたっぷりとして、音場も広大。なかなかに素晴らしい音で、さらにきつさが少なく「アナログ的な」音を堪能できます。

R2R DACはDSDをデコードできないのでたぶんFPGAで前段でPCM変換していると思いますが、DSDの曲を再生してみても上質に再生ができます。R2R DACに入るときはすでにPCMになっていると思うので、NOS/OSの切り替えでも音は変えられると思う。

IMG_5952_s.jpg

* OSとNOS、AとABの切り替え

R2R DACは別名をNOS DACともいい、普通はR2R DACはNOSで固定されています。先に書いたようにNOSがやはりR2R形式を取るときの売りになりますからね。ただHIFIMANのヒマラヤDACもそうですが、最近では切り替えられるものも出てきています。
この切り替え機能はSE300の特徴なのでいろいろと変えてみました。

上のインプレではずっとNOS/Aで聴いてきましたが、DACモードをNOSからOSに変えると音は艶っぽさや温かみという有機的な感覚的な良さが少なくなり、すっきりとした端正な音色となります。こちらの方が従来のDAPの音色に近い感じです。
アンプモードをABにするとやや平板的になりますが音が明るく開けたように音が広がります。またAに戻すと音が滑らかになり、やや音調が暗く中央に集まる様な感じの音になります。

ただOS/ABの組み合わせでも他のDAPよりは音のきつさは少ないと思います。OS/ABだと他のDAPに近づきますが、SE300の効果はないかというとそういうわけではなく、それで他のDAPと比べてもギターのピッキングでのデジタルっぽさやきつさは少ないので、アコースティックデュオのアコギの速弾きだとOS/ABの方が魅力は分かりやすいと思う。
艶っぽいとか美音という感覚的な良さを加えるのがNOSで、さらに滑らかで温かみのある音を実現するのがA級増幅。だから従来のA&KでDSDネイティブ再生のような音再現を実現したいときはOS/ABが良いと思う。

例えば四重奏で弦をかき鳴らす様なところでは、DACモードがNOSだと一つ一つの弦の音が華やかで複雑な色彩感が感じられ、OSだと一つ一つの弦の音はより落ち着いてすっきりと透明感が高く感じられます。アンプモードをAにすると演奏全体が中央に集まって滑らかで多少暖かな印象となり、ABにすると演奏全体が左右に広がってやや冷たく感じられます。
ただし色彩感と書いたけれども、言葉を変えると雑味という人もいるかもしれない。NOSの効果というのは人の感じ方に左右されるかもしれないわけです。
好みの問題ですが、個人的にはNOS/Aが好き。でもSE300の場合にはNOS/ABもいいと思います。SN感や音場感とか音性能の良さと、艶とか味の様な感覚的な良さを両立させている感覚です。
ただ暖かいという表現を使うけれども、着色感という意味では暖色のような色つけは少なく、主に滑らかで柔らかいだけど、柔らかいというとSNが低いようにも感じられるので避けています。
SE300では鮮明な音ながらキツさは抑えられた「アナログサウンド」がポイントです。アナログというと古くてもっさりした感があるかもしれませんが、ハイエンドのLPターンテーブルのシステムで音を聞けばその思い込みは一掃されるでしょう。「アナログサウンド」というのは昔ながらの古い音というわけではありません。

*まとめ

SE300は個人的にとても音が気に入ったDAPです。
SE300を聴いているとなにかこの感覚昔聴いたことがあるなあと思ったけど、それはレイ・サミュエルズさんのSR71だったかもしれない。なにか音がとても細かく聞こえるのに、躍動感があって暖かみがあるのに魅力を覚えたのを思い出します。それと昔の黒箱時代のLINNとか、心地よいのでもっと聴きたいと思わせるような魅力的な音再現があるように思う。

IMG_6191_s.jpg

当然ではありますが、このNOSやAクラスの音の良さはBluetoothレシーバーとしても、ストリーミング再生でも楽しめます。これは画期的なことです。前に書いた様にむしろストリーミングやワイヤレス時代だからこそPCMに強いR2R方式が生きているということもできます。DSD音源はまだまだ少ないし、ストリーミングはPCMなので、一般的なPCM音源でずっとDSDネイティブ再生で聴いている様なスムーズな音再現ができるのがR2R DACとは言えます。
R2Rは古いイメージがある設計ですが、むしろワイヤレス時代、ストリーミング時代のいまこそ輝いているのかもしれません。これはSE300が掲げる「Future of Analog sound」というテーマに沿っています。
そしてA&Kの最新の低ノイズ設計を併せて現代にR2Rを蘇らせたのがSE300であり、それがAstell & Kernが今テーマにしている「アナログの音」の体現と言えるでしょう。
posted by ささき at 08:12 | TrackBack(0) | __→ AK100、AK120、AK240 | このブログの読者になる | 更新情報をチェックする

2023年06月20日

アスキーにLE Audioを実際に試聴したレポートを執筆しました

アスキーにLE Audioを実際に試聴してみましたというレポートを執筆しました。
下記二篇です。

ついにLE Audioに対応したLinkBuds Sの音を聴く、低遅延には魅力あり
https://ascii.jp/elem/000/004/141/4141415/

なぜ、LinkBuds SのLE Audio対応はベータ版なのか? ソニーに確認した
https://ascii.jp/elem/000/004/140/4140465/
posted by ささき at 08:26 | TrackBack(0) | ○ 日記・雑感 | このブログの読者になる | 更新情報をチェックする

ヒマラヤDAC搭載の音質優先完全ワイヤレス「Svanar Wireless」レビュー

Svanar WirelessはHIFIMANが開発したANC搭載の完全ワイヤレスイヤフォンです。ANC搭載ながらも、あらゆる点で音質優先が徹底されているのがポイントです。本日6月20日に発売が開始され、価格は79,860円(税込)です。

IMG_0485_filtered_s.jpg

特徴

1 R2R DAC「ヒマラヤ NANO」とバランスアンプを搭載

普通の完全ワイヤレスイヤフォンではオーディオ回路がBluetoothの通信チップに統合されているために音質はそれなりということになります。
このSvanar WirelessではBluetoothの通信チップとは別に独立したDAC回路とアンプ回路を搭載することで、その制限を超えてより本格的な音の再生が可能です。HIFIMANでは過去にTWS800というこうした設計の先駆的な完全ワイヤレスがありましたが、その延長上にある製品といえます。

スクリーンショット 2023-06-18 7.51.31_s.jpg

さらに特徴的なのはそのDAC部分にHIFIMANが独自開発したヒマラヤDACを搭載していることです。これはヒマラヤNANOと呼ばれるさらなる小型版を開発しているようです。ヒマラヤDACとはHIFIMAMが独自開発したDACで、R2RラダーDAC設計を採用したいわゆるマルチビットDACです。これはPCMの再生時にデジタルっぽさを低減するというメリットがあります。ヒマラヤDACは高性能DAC ICであるPCM1704並みという高音質を実現しただけではなく、他の高性能DAC ICの数十分の一という低消費電力を特徴としているのもポイントです。
また独立したアンプ部分はなんとバランス出力が採用されています。このことにより一層力強い再生が可能となります。
つまりイヤフォンの中に小さなDAC内蔵ポタアンが入っている様なものです。しかもそれがR2R DAC、バランス駆動アンプというマニアックな仕様というわけです。この辺はマニア市場で好評を得ているHIFIMANらしさ全開と言えます。

2 HIFIMAN独自のトポロジー振動版を採用

Svanar WirelessではDACやアンプの様なエレクトロニクス部分だけではなく、音響部分でもHIFIMAN独自のトポロジー振動版を採用することで高性能化が図られています。トポロジー振動板とはHIFIMAMが独自開発した振動版の技術名称です。

スクリーンショット 2023-06-18 7.51.14_s.jpg

振動板上にナノサイズの粒子をさまざまな形状やパターンにした層を組み込むことで、これらのナノサイズコーティングが振動版の動きを正しくチューニングすることができ、そのためドライバーの音質の最適化ができるという技術です。つまりナノサイズの粒子で振動板の動きを正しくコントロールすることができるというわけです。

3 ANCと外音取り込み機能を搭載

Svanar Wirelessでは音質だけではなく、アクティブノイズキャンセリング(ANCモード)と外音取り込み機能(トランスペアレント・モード)も搭載されています。これらは左ユニットのボタンを長押しすることでモードを変更させることができます。
ANCモードはANC ディープノイズキャンセリングと呼ばれていて、最大で-35dBのノイズ低減効果があるとのことです。

4 HIFIモード搭載

面白いのはアクティブノイズキャンセリング・モード、トランスペアレント・モードの他に音質優先のHIFIモードが搭載されていることです。
このHIFIモードのときにはANCモードよりも再生時間が短くなるというのが音質優先の製品らしい特徴です。Svanar Wirelessはトランスペアレント・モードの時に約7時間、ANCモードの時に6時間、HiFiモードの時に約4時間の再生が可能です。
おそらくはHIFIモードの時にバランス出力になるのではないかと思いますが、ここは詳しくはわかりません。

5 人間工学的なデザイン

Svanarとはスエーデン語の白鳥を意味する言葉のスヴァナールから来ています。Svanarは白鳥という意味で、HIFIMANでは形状が白鳥を模したイヤフォンをSvanarと呼んでいるようです。フェイスプレートはカーボンファイバーで反対側はABS樹脂製です。有線のSvanarは真鍮製ですが、これはワイヤレスで電波を通す必要性からでしょう。

スクリーンショット 2023-06-18 7.52.00_s.jpg

Svanar Wirelessはたくさんのエレクトロニクスが満載されているからか多少大柄なシェルのサイズなんですが、この白鳥を模したような人間工学的なデザインにより装着感を向上させています。充電ケースもユニークで未来的な造形がなされています。ケースは本体を3回分充電することができます。

IMG_0927_filtered_s.jpg
パッケージ内容物

この他の特徴としてはBluetoothのコーデックとしてはSBC、AACに加えてLDACにも対応しています。

* インプレ

製品を手に取るとまずケースのユニークな形状に感心してしまいます。まるでSFの小道具のようです。本体もユニークな形状で大柄な回路とかドライバーが詰まっている感じがします。ただし軽量でユニバーサルイヤフォンのような曲面が耳にぴったりフィットすることで装着感は快適です。

IMG_0481_filtered_s.jpg  IMG_0483_filtered_s.jpg

操作はタッチコントロールで、フェイスプレートの四角い部分をタップすることで行います。タップするたびにピッとトーンが出るのでわかりやすく使用ができます。
ANCや外音取り込みのモード切り替えは左ユニットを3秒長押しで切り替えができます。ANCを電車内で使用するとガタガタという騒音はスッと消えてゆきますが、車内アナウンスは聞こえています。他のANCと比べてそう劣る様でもないように思います。音質優先の完全ワイヤレスではありますが、ANC機能も思ったよりも良く効く感じです。外音取り込みはレジで使ってみると、AirPodsみたいに強調されるような感じではないが、自然に使える感じです。
HIFIモードと他のモードではあきらかな音質差があります。またANCオフでも地のパッシブノイズ低減でわりと音は低減できます。そのため、基本的にはHIFIモードで使うことをお勧めします。音楽は基本的にHIFIモードにして電車内で本を読みたい時などにANCにすると良いかもです。

IMG_0486_filtered_s.jpg  IMG_0488_filtered_s.jpg

音質は端的に完全ワイヤレスイヤフォンとしては前例がないほど高音質です。特にアナログ的で豊かな高性能オーディオを思わせるようなサウンドが感じられ、とても強い力強さをも感じます。これはR2R DACとバランス回路が効いているからでしょう。完全ワイヤレスとしてはちょっと驚くほどで、思わずケーブルでDAPに繋がっているんじゃないかと錯覚して手が動くほどです。
楽器音はとても細かい音まで解像する感があり、音場の立体感も包み込まれるように感じられます。帯域バランス的には低音重視で、低音が太く豊かで音のスケール感があります。しかしDACやアンプの効果なのか、低音はタイトで歯切れも良いのでコンシューマー的な緩んだ低音の強調感ではありません。しっとりとしたジャズヴォーカルものを聞いていてもそうベースが誇張した違和感はないので普通に聞けるレベルで盛り上げている感じがあり、本当に高性能DAPが耳に詰まっている様な音の制御の巧みさが感じられます。低音が太く豊かで広がりもあるので音にスケール感があります。
このように音傾向はフラットではなく低域が強調されたサウンドですが、もともと回路と一体型なので様々なDAPに合わせる必要はないので、上手に味付けがなされているといえるかもしれません。
またANCは音が出てるのと同じ振動板を動かして逆位相作るのであまりいいことではなく、特に低音再現に影響するとも言われています。そういう意味で低音に強いサウンドにしたのは差別化という点でもありなのかもしれません。

IMG_4448_s.jpg

楽器音はとても細かい音まで解像する感があり、音の立体的な広がり方も気持ちよく包み込まれるような感じで立体的な広がりです。エレクトリカとか曲によっては音が自分の周りを飛び回るように聞こえる感じもします。完全ワイヤレスではあまり味わったことがないほどのレベルです。音が絡み合うような複雑な曲で真価を発揮します。
ヴァイオリンの音では響きの余韻が感じられ、音に厚みがあって、より耳に近く感じられます。少し前列で聞いている感じです。声自体は明瞭感があってはっきりと聞こえて、歌詞もよく聞き取れます、ここはさすがにDACの解像力の高さでしょうね。
パーカッションやドラムのアタックの叩きつけるような鋭さも完全ワイヤレスではおよそ聴いたことがないレベルです。アタック感があるのでロックにも良いです。また細かい音を再現するのでクラシックやジャズトリオにも向いています。

IMG_4453_s.jpg

他にもDACが独立内蔵されているTWSがありますが、Svanar wirelessはDACもさることながらアンプが強力な気がします。それがこの豊かな音鳴りと空間表現の元になっていると思います。そして楽器音がきつくなくアナログ的な感じがするのはヒマラヤDACの効果ではあるでしょう。
AirPods Pro2に比べるとかなり音質は普通に据え置きのオーディオ機器で聞いているように感じます。比較するとAirPods Pro2の音はやはりコンシューマデジタル機器の音で、かなり薄く軽く感じられます。AirPods Pro2は化学調味料で味付けした音で、Svanar Wirelessは自然のダシで味付けしたオーディオ機器らしい音とも言えます。
HM800はハイインピーダンスドライバーという点にポイントがあって、ゲインが大きすぎた気もするけど、Svanarは欲張らないで自然に鳴っている感じです。

Main.jpg


例えると普通の完全ワイヤレスはiPhone直差しの音、これはDAC内蔵ポタアンを通した音。一般的なスティックDACよりも広がりの点で優っている。完全ワイヤレスは仕組み上元々モノDAC・モノアンプですし、さらにバランスですからね。
楽器音の解像力と滑らかさはDACの良さ、空間表現と厚みはアンプの良さかもしれません。

まとめ

マニアックな製品だけど思ったより普通にANCイヤフォンとして使える。ポケットに入れやすさ、外音モードへの切り替えとかもう少し改善
音が良いのにケーブルもなにもないので違和感がある。
まるで上質のDAC内蔵ポタアンと高性能イヤフォンが耳の中に詰まっている不思議な感覚さえ覚えるような、大変音質に優れた完全ワイヤレスイヤフォンだ。
R2RはPCMに強いのですがDSDに弱いという欠点もあります。しかしBluetoothワイヤレスの場合にはこの欠点は問題になりませんので、完全ワイヤレスにはとても向いているのがヒマラヤDACの利点がフルに発揮されている。
posted by ささき at 07:00 | TrackBack(0) | __→ HiFiMan HM-901, 801 | このブログの読者になる | 更新情報をチェックする

2023年06月01日

Astell & Kernの独自サウンド、AK ZERO2レビュー

「AK ZERO2」はAstell & Kernブランドでのオリジナルでの独自開発イヤフォンの「AK ZERO1」に次ぐ第二弾です。
初代AK ZERO1の開発で得た知見を元に、「先進の技術を用いてAstell&Kernの原音追求の哲学を詰め込んだ」というモデルということ。PathfinderはどちらかというとCampfire Audio色の強いイヤフォンなので、ZEROシリーズは独自の考え方で開発したということだと思います。5月20日に発売が開始され、直販価格は179,980円(税込)です。

IMG_9911_filtered_s.jpg

特徴

ZERO1と同様に多種のドライバーを組み合わせるというマルチドライバー構成ですが、ZERO1が平面駆動(PD)ドライバー、BAドライバー、ダイナミックドライバーの3種類だったのに対して、ZERO2ではそれにピエゾドライバーを加えた4種類に増えています。
ZERO2では全部で6基のドライバーを搭載しています。平面駆動(PD)ドライバーx1、BAドライバーx4、ダイナミックx1、それにピエゾなら7個ではないかと言われるかもしれないですが、ダイナミックとピエゾは後述するように一体型なので6個とカウントしているようです。

IMG_9924_filtered_s.jpg
SP3000とAK ZERO2

高域は平面駆動(PD)ドライバー(マイクロ・レクタンギュラー・プラナードライバー)が搭載されています。これは面上に整形されたコイルによって駆動することで、ダイナミック型のような臨場感を両立したサウンドキャラクターを実現したとしています。
そして中低域にはフルレンジでデュアルカスタムBAが搭載されています。フルレンジという意味はクロスオーバーが介されないという意味のようです。また中域にはクロスオーバーが介されたデュアルカスタムBAが搭載されています。
BAドライバーが4基で中域と中低域をオーバーラップして担当しているわけですが、2基のBAを帯域カットして2基のBAをフルレンジとしている理由は、A&Kに問い合わせてみるとトーンのコントロールをするためだそうです。つまり全部カットするよりも半分カットして半分フルレンジだと中間の落とし方が出来るので、チューニングのグラデーションが付けられるということのようです。

内部展開イメージ.jpeg

また低域と超高域にはピエゾトランスデューサーと一体型の10mm径ダイナミックドライバーが搭載されています。これはピエゾが超高域を担当して、低域担当のダイナミックドライバーと一体型になっているとのこと。良く分かりにくかったのでこれもA&Kに問い合わせてみると、超高域用のピエゾはダイナミック型と同軸に配置してあるそうです。ダイナミック型はピエゾの真ん中の穴を通るが、ピエゾ素子が音響的にダイナミック型の音響抵抗(厳密には違うがローパスフィルター的な役割)になっていて、低域以外の帯域をカットする役割になるとのこと。ちなみにピエゾはダイナミックの前にあるが、パッシブラジエーターの役割はしていないそうです。この方式のメリットは、ダイナミックから見るとピエゾがフィルターの役割をしていること、ピエゾから見るとダイナミックと同軸上に配置できることで高域が整うということです。

こうしたことからかなり個性的な設計がなされたイヤフォンだと言えますね。この4種の異なるドライバーを超精密なクロスオーバーネットワークで調和させ、3Dプリントによるアコースティックチャンバーで最適に配置、さらにCNCアルミハウジングで共振を抑制することで極めて優れた音域バランスと超低歪を実現しているそうです。

IMG_9912_filtered_s.jpg

アルミニウムCNC切削によるシャーシで、Astell & Kernらしい造形を感じさせるデザインはIFデザイン賞を受賞しています。ケーブルは着脱可能で、MMCX端子を採用。付属ケーブルはHi-Fiグレードの4芯純銀メッキOFCケーブルで、3.5mmと4.4mmの2種類。5サイズのシリコンイヤーピースと1サイズのフォームイヤーピース、キャリングケースも付属しています。日本製造で、日本の経験豊富な技術者によるハンドメイドと最新の設備を用い、「厳しい工程を経て最高レベルの品質を実現した」とあります。たしかにこれだけの数と種類のドライバーをまとまりのある音に仕上げているのは組み立ての精密さもあるでしょう。

インプレ

10mmのダイナミックドライバーを含む6つのユニット、チャンバーと筐体が大柄ですが、重さはそれほどでもありません。デザインがよく金属らしい質感も良いですね。シックな印象もあって年齢によらず装着しても違和感が少ないと思います。大柄なボディですが装着感は悪くなく、形状がぴったりと耳に収まる感じがします。ケーブルは高級感があってしなやかで使いやすいと思う。

IMG_9905_filtered_s.jpg IMG_9910_filtered_s.jpg
AK ZERO2パッケージとケース

まず4.4mm、付属シリコンイヤーピースで、SP3000で聴いてみました。
パッと聞いてその音質の高さに驚くとともに、SP3000だとあまりにサウンドが異次元すぎるという事案が発生。SP2000Tにしましたが、やはりチューブモードだと異次元レベルの音になります。オペアンプモードでなんとなく現実世界の音が良いイヤフォンに戻ってきた感じです。
まず音世界の立体感が特筆もので、低音の深みがすごいというのが第一印象。そして聴いていくと音の描き方が緻密だということがわかります。解像力も極めて高く、楽器の鳴りが静まっていく残響音もよく聞き取れるます。
アンビエント風のシンセサイザーで包まれるような空間表現が得意で心地よく、曲が進んで女性ヴォーカルが入って歌い始めた時にはっとするくらい声のリアル感と肉質感が感じられます。中高域は鮮明でクリアでかっちりとした音再現。声の再現性が良く、ささやきから歌詞を朗々と歌い上げるまで、広い表現範囲でとてもスムーズでかつ緻密に感じられます。解像力も高いのでヴォーカルはリアルで声の肉質感がよく描き出されている。男声と女声の声の質感の違いがよくわかります。

IMG_3979_s.jpg

PDにピエゾと高域はだいぶドライバーが集中しているんですが、高域は伸びやかでベルの音もキラキラしているが、きついという意味ではまったく強くないですね。そのため聞きやすくキツさを感じないのが不思議なくらい。
低音はかなり分厚くて太く深みがあり、叩きつけるような鋭い打撃のアタックも感じられるが、きつさが少ない感じです。よくチューニングされていますね。ダイナミックドライバーの音の重みがハイブリッドらしく聞こえるんですが、低音はそれでいてすっきりしているのでハイブリッドにありがちな低域と中高域の別物感はないのも特徴です。この辺の音が滑らかで快調再現があるのはBAの上記した特徴が生きているのかもしれません。ピエゾハイカットや巧緻なクロスオーバーの効きが良いことと、BAフルレンジ使用の滑らかさなどですね。
SP3000とZERO2だと圧縮音源のストリーミングと内蔵のロスレスとの差が大きすぎて、圧縮音源のストリーミングで聞くのがもったいなくなります。録音の良し悪しも、新旧もかなり良くわかる感じ。ちょっと聞くと滑らかな音タイプだけれども、実はかなり緻密に音を描いていると思います。

IMG_4165_s.jpg

スティック型DACのPhatlab RIOを接続してみると、RIOはPhatLabのポタアン並みの性能あるのでちょっと驚くくらいのサウンドが味わえます。M2 Macbook Airとの組み合わせではこれいいと思う。とても解像度が高く、すごくワイドレンジというのがわかります。ZERO2が音を階調豊かに細かく描いてるのもよく分かります。RIOはハイパワーの分でホワイトノイズが少し多いのでPathfinderはおすすめできないけど、ZERO2は大丈夫です。

IMG_4246_s.jpg
RIOとAK ZERO2

ZERO1との違い

ZERO1に比べるとかなり違いは大きいと思います。また単なる後継というわけではないと思う。また一方で音傾向が違うのでZERO1の音が好きという人もいるかもしれません。
まずフラット基調から低域が厚めの音になったことです。ZERO1はフラットというかモニター的だったけど、ZERO2では低音が分厚くなって、少し暖かみもあります。ZERO2では低音は誇張されずに深みがあって豊か、量感があります。ZERO2では音がスリムになりすぎないで、ニュートラルではあるけれどもやや低音が多くてとても豊か。ロックやポップでも十分な低音はあります。


まとめ

音の立体感包まれ感、厚みと豊かさ、低域のパンチ、楽器音の鮮明さなど、ZERO2はおそらく現在トップレベルの能力があるイヤフォンだと思います。筐体が質実剛健ですが、これを宝石のようなフェイスプレートにしてユニバーサルデザインにするともっと高価でも納得してしまうかもしれません。そのくらいの驚きがある音ではあると思う。音性能の高さもさることながら、これだけの種類のマルチドライバーを有した個性ある設計なのに、まとまりのある音に仕上げているのも優れた設計だと思います。新しい音世界を提案してくるようなPathfinderに比べるとより自然な音でよくまとまっているのも特徴でしょう。

IMG_4147_s.jpg

多少暖かさがあって、滑らかで広がりがある。かつ音はクリアで芯があって緩くない、という音の印象からはアナログの音というAstell & Kernの新しいテーマに沿ったチューニングのようにも思います。その意味ではAstell & Kernの今のサウンドを体現した新製品といえると思います。
posted by ささき at 10:18 | TrackBack(0) | __→ AK100、AK120、AK240 | このブログの読者になる | 更新情報をチェックする

2023年05月22日

独自ICを搭載した高性能スティック型DAC、L&P W4/W4EXレビュー

以前LUXURY&PRECISION W2-131を下記記事で紹介しました。これは同社W2の進化系でした。
http://vaiopocket.seesaa.net/article/485813717.html
その後継機として開発されたのが、「W4」74,800 円(税込)、「W4EX」52,800 円(税込)の 2 機種です。これらは5月24 日に発売となります。このWシリーズは形式的にはスティック型DACですが、LUXURY&PRECISION製品の位置付けとしては同ブランドのエントリー級DAPとなるようです。つまり低価格の製品が多いスティック型のDACとは一線を画すものという意味合いのようです。

IMG_0128_filtered_s.jpg
L&P W4

W4シリーズの最大の特徴はW2-131ではDAC ICにシーラスロジック製のCS43131(CS43198のアンプ内蔵版)を2基搭載していたのに対して、W4シリーズではどちらの機種も L&P 独自開発の DAC チップが搭載されている点です。W4はLP5108、W4EXはLP5108-EXを使用しています。
これにより端的にいって出力はW4の場合にはバランスで420mWと据え置き並みの高出力となり、W2の1.7倍のパワーを誇ります。ダイナミックレンジ(134dB)と低歪率はW2をさらに超えています。しかもW2の半分の電力消費という点がポイントです。
W4EXの場合にはSN比はW2同等、バランスの出力がW2とほぼ同じで、歪みはW4には劣るがW2よりは優れているということになります。カスタムチップのアンプ部分はAB級ということです。

IMG_0136_filtered_s.jpg  IMG_0138_filtered_s.jpg
L&P W4 正面と背面

また筐体デザインも変更されています。液晶は斜めに設置されてアクセントになっています。また調整用のつまみがアップダウンボタンからロータリー式に変更されています。イヤフォン端子は3.5mmアンバランスと4.4mmバランス端子に対応しています。3.5mm端子はSPDIF出力用にも使われます。
PCMは384kHzまで、DSDはネイティブでDSD256形式まで再生可能です。

機能的にもW2シリーズ同様に01と02の音質モードを切り替えることができます。メーカーの説明では01ではポップスのようなヴォーカル主体の音楽に向いたリラックスした音で、02ではより洗練されて複雑なシンフォニーなどに合うということです。
この他にもイコライザーのプリセットモードとして、Normal / CLASS / JAZZ / ROCK / POP / BASS / MOVIE / GAMEが用意され、機種向けイコライザー設定として Xelento / IE800S / SE846 / IER-Z1Rが用意されています。サイズは63 x 24 x 12.5mm、重さは24gと軽量です。

IMG_0126_filtered_s.jpg  IMG_0127_filtered_s.jpg
W4の内容物

箱にはW2シリーズ同様にUSB-Cのケーブルとライトニングケーブル、USBアダプター端子が同梱されています。これによって、PC、Android、iPhoneなどさまざまな接続が標準で可能です。なおケーブルはメーカーのプレゼント扱いということなので保証対象からは外れるということになると思います。

IMG_0122_filtered_s.jpg
左からW2-131、W4、W4EX

以前レビューしたW2-131と比較してみると、筐体はやや大きくなっていますが、重さはほぼ同じです。ディスプレイが斜めになっていてより現代的な感じのデザイン的なアクセントになっています。輝度などディスプレイの視認性はほぼ同じくらいだと思います。
またW4では従来のアップダウンボタンではなく、独立したボリュームつまみがついたのが大きな違いです。これはモード変更ダイヤルもかねています。このおかげで操作性が向上して上質感も増しています。
W4とW4EXは外観状は色が違うだけのように見えます。W4はシックなグレーで、W4EXは若々しいブルーを基調にしています。

IMG_0132_filtered_s.jpg  IMG_0134_filtered_s.jpg
左W4と右W4EX、iPhoneとARAの組み合わせ


W4を前回のW2での記事と同じくiPhoneとCampfre Audio ARAで聴いてみると、とてもクリアで透明感が高いサウンドです。SN感が高く、音の歯切れが良く細かい音がよく聞き取れます。クールでニュートラル、フラット基調なのはW2同様ですが、より洗練されてプロサウンドのような感じがします。シャープで線が細い音です。空間的な広がりが良く、アコースティック楽器音の鳴りがリアルで、ヴォーカルは発音がとても明瞭でわかりやすいですね。
音がフラットでシャープなのでイコライザー設定を変えると音が大きく変わります。この辺で味付けしてみても良いでしょう。チューニングモードの01と02はそう大きく変わりませんが、たしかに変わりますのでこれは音の微妙な表情を変えたり、イヤフォンに合わせて好みで変えるのが良いと思います。

IMG_0139_filtered_s.jpg
左W2-131、右W4

W4の音をW2-131と比較すると、以前よりもさらにクリアになって、楽器音の音がより鮮明でシャープに聞こえます。アコースティック楽器の歯切れ良さがより鋭く、パーカッションはより打撃力があって、叩いている音の鋭さが鮮明です。W2-131よりもフラットになり低音が抑え気味に感じられます。スタジオ的とかモニター的な音により近い感じですね。
W4とW2-131は聴き比べて十分わかるくらいの差がありますが、W2-131ユーザーならば聴き比べなくても音の違いはわかると思います。比較するとW2-131の音がやや緩く聞こえるほどです。

IMG_0121_filtered_s.jpg
上W4、下W4EX

W4とW4EXを比較すると、音のクリアさではほぼ互角ですが、音の広がりや厚みという部分でW4の方がやはり上回ります。またW4の方が力強い感じです。これはDAC部分というよりもアンプ部分の性能の差が出ていると思います。ただ透明感や解像力での差はわかりにくいくらいではあります。
W2-131とW4EXを比べると、音の透明感やシャープさではW4EXの方が優っているように感じられますが、音の広がりなどではあまり差は大きくないと思います。

確かに製品のイメージとしては、よりクリアで鮮明なL&PのDAPの音に近づいたように思います。比較してみるとW2はやはりやや温かみがあるシーラスロジックの音の着色感は感じられます。おそらくは自家製のICを作れたことでよりL&Pのイメージに近い音にすることができたのだと思います。

なおW4 シリーズ専用のレザーケース「W4 Leather case」5,500 円(税込)とWシリーズとデジタル接続が可能なケーブル「WP2」26,400円(税込)をも販売するということです。「WP2」はU58(銀箔巻き高純度銅)と U75(金箔巻き高純度銅)のハイブリッ ド構成、低誘電率被膜の採用で外部電波の干渉が抑えられるとのこと。アクセサリーは直販サイト(CYRAS DIRECT)でのみ販売ということです。
posted by ささき at 14:58 | TrackBack(0) | ○ ポータブルオーディオ全般 | このブログの読者になる | 更新情報をチェックする

2023年05月01日

春のヘッドフォン祭のレポート記事をアスキーに執筆

春のヘッドフォン祭のレポート記事をアスキーに執筆しました。

https://ascii.jp/elem/000/004/135/4135277/
posted by ささき at 15:08 | TrackBack(0) | ○ 日記・雑感 | このブログの読者になる | 更新情報をチェックする

2023年04月26日

GoogleのAI「Bard」レビュー(というよりメモ、2023/4時点)

BardはGoogleがリリースしたAIチャットbotです。いわばChatGPTへの危惧を抱いたGoogleが出した対抗版と言っても良いでしょう。Bardについてはネガティブな風評もありますが、使ってみたところ面白いのでAI版BingやChatGPTとも少し比較したメモがてらアップします。
Bardというのは(ケルト文化における)吟遊詩人という意味です。吟遊詩人というのは昔からの「知識データ」を声で伝え聞かすものですからふさわしいとも言えますね。

Bardは現在のところ日本語での会話はできません。つい最近ようやく日本からのアクセスができるようになりました。アクセスには有効なGoogleアカウントでログインしたブラウザから申し込みます。(AI版Bingとは違って許可のメールはこないので自分でアクセスできるか確認が必要です)

*2023/5/11 PaLM2の導入により、日本語が使えるようになりました

IMG_2261.JPG  IMG_2265.jpeg

使い方はChatGPT同様です。
特徴としてはView Draftを選ぶと回答の他のDraft(回答例)も提示できる点です。この点でやはりランダム要素が入ってると推測でき、やはり幻覚問題もあるだろうとも推測できます。
よく言われる生成AIが嘘をつくという問題は以前アスキーの記事でも指摘しましたが、これは一般に幻覚(Hallucination)と呼ばれます。これは生成AIが言葉を生成する際にランダム性が介入するなど複数要因によるものです。なぜAIにランダム性が必要かというと解答の多様性を得るためです。そうでないと同じ質問に何回も同じ解答をするなど人間らしくない動きになります。つまりは「人間性」というプログラムできないものをシミュレートするものがランダム性の追加ともいえるでしょう。
ちなみに生成AIというのは技術的にいうとトランスフォーマーというタイプのニューラルネットワークです(GPTのTがTransformerです)。例えばスマホの予測変換の候補をつなげていくと雑ですが文にはなります。乱暴にいうとそれをすごく高性能にしたものとでもいえましょうか。ですから生成AIはただのソフトウエアで、自我を持つとかAIが人間を支配するなどというのとはまだまだ別の話です。そこをランダム性で人のように見せかけているというのが現時点だと思います。(ランダム性の介入は画像生成AIでも同じ)

Bardに関するマニュアルとか文献というのはないので今回の記事もBardとの対話から得たものですので念のため。

* Bardとはなにか

まずBardというのはソフトウエアとしては人間から直接見えるAIチャットbotの名前です。Bardは単一のソフトウエアではなく、システムとしては複数の大規模言語モデル(LLM)からなる分業制をとっています。
AI研究はディープラーニング以前と以後で大きく変わったので、大規模言語モデルの大規模とはディープラーニング以後という意味です。つまりLLMとはディープラーニングを用いたニューラルネットワークによる言語処理ソフトウエア、端的にいわゆるAIのことです。つまりBardは複数のAIの分業性で一つの解答を出します。
具体的にいうと、BardはPaLM、LaMDA、Meena、Bart、GPT-3のLLMの集合体で、メインで動いているのはPaLMとLaMDAです。
例えば私が「フランスの首都はどこですか?」とBardに聞くと、まずLLMのPaLMが質問の理解をし、LLMのLaMDAが"パリ"という回答を生成します。LaMDAがBardの中では回答責任者のように振る舞うようです。ここはポイントです。
それで他のLLMのMeena、Bart、GPT-3はさらにパリの人口や歴史を加味した回答の肉付けをするというわけです。以下で具体例に触れます。

* Bardを情報検索に使う

Googleらしく情報取得という点ではBardは優秀です。
ChatGPTでは2021年までのLLM固有の知識しかなく検索はできません。AI版Bingはプロメテウスという構造で検索とLLM固有知識の二つを合わせられますが、OpenAIとMicrosoftというつぎはぎの構図は否めません。
Bardに「本日のワシントンポストのトップニュースは?」と聞くと即座に解答を示し、念のために調べると正解を示していました。AI版Bingのように「検索しています..回答は」というような継ぎ目はありません。
Bardは最新情報を得るにはGoogle検索と大規模言語モデル(LLM)の逐次更新と両方やります。面白いのはGoogle検索できない情報もLLMには学習されてるということです。これはGoogle検索のインデックスされてない情報もLLMでは学習の対象になってるからで例えばこういうデータだそう。

IMG_2260.JPG

Bardに「今日の新聞のトップニュースは?」と聞いた場合には、まず回答責任者であるLaMDA LLMが自分で答えられる場合には検索せず、答えられない場合には検索にいくという判断をするようです。
この点でAI版BingではLaMDAのような回答責任者がいないので、何でもかんでも検索に行ってしまって待たされる、挙句には会話の文脈(コンテキスト)がずれてしまうという事態にもよく陥ります。
この点で検索にしてはBingより速いがとBardにいうと、それはGoogleがBingより優れてるからですよ、と自信たっぷりに言う点もポリシーという点では面白いところです(もちろん私は開発中で、という免責事項もいいますが)。Bingでは表現はもう少し謙譲的ですね。この辺は会社ごとのコンテントポリシーの違いなんでしょうか。
ただし3日前のトップ記事を解答し、指摘するとただしい本日の記事を出力するということもあります。この辺は自分の情報と検索の必要性の整合性が完全に取れていないのかもしれません。

またBardはChatGPTだと箇条書きのところを表にしてくれるのが何気に便利でもあります。

* Bardを物書きに使う

創造性という意味ではBardはあまり得意ではないように見えます。
Bardに「猿の手」のバリアントを書かせてみたら、不幸な結末が可能で怖い雰囲気も加味していたんですが、プロットが下手で一貫性がありません。アイディアも凡庸です。
以前ChatGPTに猿の手のテーマで書いてと頼んだら、何回手直しをさせても不幸な結末が作れずに恐ろしい雰囲気が作りにくいものでした。これはOpenAIのコンテントポリシーによるものだと思われます。いわばAIの「良心回路」です。ただしこのボリシーは自由度を失わせます。(イーロン・マスクのtruthGPTではこの良心回路をはずすと言っているわけです)
意外とGoogleが設定したポリシーはきつくないのかもしれないけれど、いまひとつ創造性的とか構築する部分は弱いように思います。また面白いのはChatGPTとかBingに小説を書かせて手直しをさせると、途中でもその部分の修正をするんですが、Bardに手直しをしてと言うと前の結果の後ろに付け足します。それも文が下手に見える原因の一つのように思います。

この点で優秀なのはAI版Bingの創造性モードで優れた小説を書けます。以前このブログで書いた「音楽ストリーミングサービスにAI作曲アプリが取って代わった時代」のショートショートはAI版Bingの創造モードで書いたものです。多少手直しを指示はしましたが全てAI生成です。急ブレーキで互いの音楽が聴こえるアイディアもAIが考えたものです。オチもよくまとまっていますがAIが考えたものです。
Bardの中ではGPT-3 LLMが創造性を担当してるようです。例えば「フランスの首都は?」と聞いたときに「パリ」が回答責任者のLaMDA LLMの答えですが、それに「パリは夢の街、愛の街、芸術と文化、豊かな歴史、有名な料理などそのすべてが揃っています」と加えるのがGPT-3 LLMです。
小説を書いてと言うとなにか検索が必要ではないので、Bingの場合には素のGPT-4の強みが発揮できるのかもしれません。Bardの場合は創造性の部分はGPT-3の担当だからその辺の「性能差」と言うのは出てくるかもしれません。

Meena LLMも創造性に関するかもしれませんが、まだちょっと調べが及び切れていません。Bart LLMはより広範な知識を足すものだと思います。

ちなみに「小説を書いて」という短い言葉から長い小説をAIが生成できるのは再帰的に自分自身を呼び出して、自分の出力した文章を次の自分の入力として数珠繋ぎに繋げられるからです。この点ではChatGPTでもBardでも同じです。何回も「小説を書いて」という言葉から異なる小説ができるのは先に書いたランダム性を加味した多様性の出力によるものだと思います。


* Bardのメタコマンドについて

AIチャットbotは会話をして進めるものと思われていますが、実は普通のコンピューターのように直接コマンドを与えることができます。これはBardだけではなく、AI版Bingもそうで、画像生成機能を使うためのloadコマンドなどがあります。これは会話と切り分けるためメタコマンド(meta command)と呼びます。
Bardにおいてはスレッドでコンテキストの切り分けができないかを試行錯誤してthreadメタコマンドを見つけました。
例えばBardには以下のメタコマンドがあります。もっとあると思います。

clear: 会話の初期化
thread <名前>: 新しいスレッドを作りコンテキストを切り替える
join<名前>: 既存スレッドに加わる
leave: スレッドから退出
ping: 複数人の会話時に使う(開発中)
back<名前>スレッドに戻る
help:メタコマンドリスト


メタコマンドは文脈などで普通の会話と区別されますが、接頭文字に#,!,$,%などを付加するのが望ましいことです。
例えば会話の文脈をリセットしたいときは「#clear」です。(これはメニューからもできますが)
それでも解釈は完全ではなく、例えば#helpと打って、メタコマンドのヘルプと理解したのは3つのドラフト回答のうち2つのみ(2と3)でした。

IMG_2264.JPG

このメタコマンドが会話とどのように違うかというと、メタコマンドの方は文の解析を含まないでダイレクトに効くので確実ということのようです。つまりは文の多様性解釈の範囲外になるわけです。検索も実はメタコマンドでダイレクトでできるようですが、あまりやるとBardが入力を弾くのであまりよろしくはありません。右上にView Draftsとでない回答はおそらくBardのソフトウエア自身が出しているメッセージ(警告に近い)だと思います。

ちなみに上のPingメタコマンドによってBardが複数人のチャット機能を開発中と言うのが分かってしまいます。


* 暫定まとめ

Bardを現時点で簡単にまとめると、
1 Bardは複数LLMの分業制で、回答責任者のLaMDAの判断で効率良く検索が出来る。また他のLLMと協業で会話に創造性や深みを加える
2 Google検索できない情報もLLMには学習されてる
3 メタコマンドを使うことで入力文の解析をバイパス出来る

などがわかってきました。

今のところ私の中でのAIの位置付けは、ディベートしたい時はChatGPT、小説などを書かせたい時はBingの創造性モード、最新の情報を得たい時はBardがいいかなと思います。Bardは日本語がまだ使えませんし、幻覚についてはまだまだ未知数ですが、素性はいいですね。色々とネガティブ風評はありますが、いまのところAIの中でBardの分業制が一番いいような気がします。ただ検索の必要性と自己知識の切り分けがまだ完全ではないように思えます。
(ちなみにAmazonのTitanやMetaのBlendarbotも単一LLMだと思います)

私見ではありますがChatGPTとBardとBingを使用して英語で会話を続けて同じことを答えさせようとすると一番よくないのがBingで、特に会話スレッドのコンテキストをすぐに忘れて話が逸れます。これは検索とAIの二重構造の副作用だと思います。
この点で優秀なのはChatGPTです。ChatGPTは単一のLLMなので一貫性が高いのかもしれません。また会話スレッドを分けているせいか、コンテキストの一貫性も高いです。Bardも長く会話してるとちょっとコンテキストの一貫性がずれていきます。それでthreadメタコマンドを見つけたわけです。
これが日本語だと、日本語はそこまで言わなくてもわかるだろうっていうコンテキスト依存の文化なのでもっと深刻になるでしょう。日本語がAIで向いてないのは単に日本語ソースでの学習不足だけではないと思います。こうした点で真の日本文化向けのAIが必要なのではないでしょうか。
posted by ささき at 11:20 | TrackBack(0) | ○ 日記・雑感 | このブログの読者になる | 更新情報をチェックする

「ついに登場、MEMSドライバー採用の高級イヤホン、Singularity Audioの「ONI」」の記事をアスキーに執筆

アスキーにずっとMEMSスピーカーの情報を報じながら、やっと来た感じです。今回はヘッドフォン祭でxMEMSの日本の方が展示します!
なんか面白いもの持ってくると思います。シリコンが出す音ってどんなのだって思う人はぜひ14FのxMEMSブースへどうぞ。担当の方は日本語OKです。

https://ascii.jp/elem/000/004/134/4134155/

MEMSスピーカーについておさらいすると、ウエハーから切り出すシリコンチップがそのままイヤフォンのドライバーになります。パーツから組み立てるのではありません。その一部がメカ動作するのがMEMSと呼ばれる技術で、この動きで空気を振動させ、圧電型ドライバーになります。
posted by ささき at 11:16 | TrackBack(0) | ○ ポータブルオーディオ全般 | このブログの読者になる | 更新情報をチェックする