The document summarizes a research paper that compares the performance of MLP-based models to Transformer-based models on various natural language processing and computer vision tasks. The key points are:
1. Gated MLP (gMLP) architectures can achieve performance comparable to Transformers on most tasks, demonstrating that attention mechanisms may not be strictly necessary.
2. However, attention still provides benefits for some NLP tasks, as models combining gMLP and attention outperformed pure gMLP models on certain benchmarks.
3. For computer vision, gMLP achieved results close to Vision Transformers and CNNs on image classification, indicating gMLP can match their data efficiency.
Raspberry Pi ではじめる機械学習(https://amzn.to/2VbGrFH)の数字認識についてまとめてます.
興味のある人はやってみてください.
詳細ブログ:https://kenyu-life.com/2018/11/06/raspberry_pi_machin_learning_numbers/
セルオートマトンについての説明スライドを作りました(日本語です)
原理と原則を説明した後に実際に,プログラムを回して挙動の確認を行っています.
詳細:https://kenyu-life.com/2018/11/20/cellularautomaton/
動画解説:https://www.youtube.com/watch?v=5O6aRFw1Zcg&t=23s
Created by 上原賢祐
Study on temperature control model of a focal cooling human physiological systemKenyu Uehara
This study developed a mathematical model to simulate temperature control of a focal cooling device using a Peltier module on human skin. Experiments using a phantom validated the model, with errors within 1.16% compared to proportional control simulations. Adding integral control improved stability and reduced steady-state error to within 0.45-1.92% of experimental temperatures. Future work will refine model parameters and test new devices to enable precise temperature regulation for medical applications.
Study on model parameters of focal cooling device using a Peltier element for...Kenyu Uehara
Created by Kenyu Uehara
Here is my blog (welcome to another research ) : https://kenyu-life.com/2018/11/04/epilepsy_braincooling_eng/
Dynamics and Design Conference 2016で発表した研究内容です.
タイトルは「てんかん波抑制における脳冷却速度と脳波帯域の関係」です.
実は,てんかん波は冷却すると抑制されます.
https://kenyu-life.com/2018/11/04/epilepsy_brain_cooling/
2012年に冷却温度に関しての論文が出ましたが,これまでどのくらいのスピードで脳を冷やして良いかなどは出ていませんでした.
今回は,山口大学医学部さんとの協力のもと,てんかんモデルラットを使った脳冷却実験と,解析した結果について書いています.
Created by 上原賢祐
Dependency of ECoG Band Spectrum in Epileptic Discharges upon Local Cooling R...Kenyu Uehara
This document summarizes research on the effects of brain cooling rate on epileptic discharges. The researchers conducted cooling experiments on four epilepsy model rats with different cooling rates. Frequency analysis found that slower cooling rates more effectively suppressed power across all frequency bands compared to faster cooling. Specifically, slower cooling of 200 seconds reduced delta wave power the most at 0.40, while faster cooling of 30 seconds only reduced it to 0.62. This suggests slower cooling rates are more effective at controlling epileptic seizures. The findings could help develop improved brain cooling devices for epilepsy treatment.
In this study,
We propose a EEG analysis model using a nonlinear oscillator with one degree of freedom.
It doesn’t have a random term.
our study method identifies six model parameters experimentally.
Here is the detail: https://kenyu-life.com/2018/11/03/modeling_of_eeg/
Created by Kenyu Uehara
この発表資料は,2018年10月25日にパシフィコ横浜で開催された,「第52回日本てんかん学会学術集会(The 52nd Congress of the Japan Epilepsy Society )」で報告した資料です.
Created by 上原賢祐
詳細:https://kenyu-life.com/2018/10/30/epilepsy_modeling/
【目的】
これまで経験的,複合的に判別されていたてんかん波に関して,脳波の振動モデルを構築し,てんかん波判別の実現可能性について検討することを目的としている.
【方法】
てんかんモデルラット4体のアルファ波帯域脳波を解析対象とする.解析方法は,生体信号モデルとしてしばしば利用される非線形振動子により脳波をモデル化し,モデル内に含まれるパラメータを実験的に同定する方法とした.モデルは,減衰性と復元性,非線形性,外部入力の信号強度,各周波数および位相差パラメタを有する.六つのモデルパラメタを約0.5秒の解析窓毎に,モデルの出力と実波形の誤差で定義される評価関数を最小とするように同定した.解析には,正常時とてんかん波の振幅が十分に発達した明らかな異常時の脳波を各10秒間ずつ使用した.同定した値からパラメタ毎の区間平均を算出し,正常時の値を基準に正規化を行った.そして得られた値を用いて,同定したパラメータの特性を正常時と異常時で比較し,てんかん波判別の実現可能性について検討した.
【結果】
4体を解析した結果,異常時の非線形パラメタは正常時の値の25%以下まで減少することが確認された.脳波などの生体システムでは,正常状態においてカオス的に振る舞いを示すが,異常が発生するとカオスが消失し周期的になることが知られており,我々の脳波解析手法においてもそれを証明することができ,本手法の有効性が確認された.さらに,信号強度パラメータは約3倍以上に増加し,測定点の脳波と周囲から伝わる波の角周波数分布にも特徴が見られた.
【結論】
本研究では,てんかん波判別の実現可能性について検討することを目的とし,てんかんモデルラットのアルファ波帯域脳波を解析した結果,正常時に比べて異常時の非線形パラメタは減少し,外部入力の信号強度を表すパラメタは増加した.さらに,測定点の脳波と周囲から伝播する波の角周波数に関するパラメタの分布範囲に違いが見られた.
日本生体医工学会中国四国支部2018で発表した研究です.
題目「ゆらぐ脳波データからどのように集中度合いを可視化するか」
Created by 上原賢祐
詳細はこちら: https://kenyu-life.com/2018/10/30/eeg_constress_value/
◯アブストラクト◯
ヒト脳波は心理・生理状態によって大きく影響される生体信号であるがゆえに,集中度合い等をはじめとしたヒトの状態推定を可能とする.脳波信号の一般的な理解では,ヒトが一旦集中状態に入ると周波数パワーが高くなる傾向にあるため,周波数解析により脳波に含まれる特定の周波数帯域の含有量を見ることは1つの有効な状態推定の手立てである.しかし,ヒト脳波はゆらぎと言われる非線形な性質を持つため,周波数解析などの線形的な信号処理では,ヒト脳波が有する真の情報を取り出すことができないと考えられる.すなわち,ヒトの集中状態を可視化するにあたっては,脳波信号の「ゆらぎ」を考慮し,波形の細かい変化の仕方自体にも眼を向ける必要があると考えられる.
そこで本研究では,非線形な解析手法を用いた脳波信号の解析を行い,ヒトの集中度合いの可視化を目的とする.脳波信号の振る舞いを一自由度の非線形振動子によってモデル化し,波形の細かい変化に対応させるため,モデル中の各係数パラメータを実験的に同定した.その結果,脳波の定量化をすることが可能であることを確認し,各モデルパラメータの相関値によって集中度合いを可視化できることが分かった.
ブログはこちらから https://kenyu-life.com/
日本機械学会の年次大会2018で発表した資料です。
発表した分野は、「医工学テクノロジー推進会議」分野の「医工学テクノロジーによる医療福祉機器開発」セッションにて研究報告をしました。
Created by 上原賢祐
脳波信号を対象としたEPIAモデル構造に関する研究 (Study on model structure of EPIA for EEG signals)Kenyu Uehara
研究ブログはこちら: https://kenyu-life.com/
Created by 上原賢祐
日本機械学会Dynamics and design conference 2018(東京農工大学)にて発表した時の資料です.
<ABSTRACT>
ヒトの思考や精神的状態など様々な要因によって変動する脳波は,非常に高次な情報を有しているが、時系列波形が複雑であるため,この高次な情報を取り出すことが困難である.そこで脳波の時系列波形の挙動を数学的にモデル化し解析窓ごとにモデルパラメータを実験的に同定するといった解析手法が有効であると考えられる.本報告では脳波解析を行うための最適なモデル構造の検討を目的として,代表的な2つの非線形振動子であるDuffing型およびVan der Pol型と,線形の粘性減衰振動子を用いた場合の結果と比較を行った.
研究ブログはこちら: https://kenyu-life.com/
Created by 上原賢祐
English Title: Analysis of relationship between epileptic discharges and its peripheral ECoG signals using coupled nonlinear oscillator
日本機械学会年次大会2016で登壇したときの資料です.
英訳:Spatial and temporal variations in epileptic discharges using coupled non-linear oscillator
連成非線形振動子のモデルパラメータを実験波形に合うように同定して,てんかん性異常脳波の時空間解析を実施しています.
13. 特徴量 1
特徴量2
サポートベクトル
サポートベクトルマージン最大化
(矢印部の長さ)
wT
x + b = 0
K2
K1
直線より下にあるデータは
クラス2に属する
直線より上にあるデータは
クラス1に属する
wT
xi + b > 0wT
xi
wT
xi + b < 0
xi ∈ K1
wT
xi xi ∈ K2
となるデータxの集合
線形分離可能なデータ
分類境界である直線(超平面)の方程式をこのように定義する
ラベル変数 ti を導入して,0より大きい形に!
ti(wT
xi + b) > 0wT
xi i = 1,2,⋯, n
w
幾何マージン
というよ! ・分類境界を決定する関数により分類器を定義する.
・データを完璧に分離する関数が存在するという仮定がある.
・サポートベクトルでない点は,分離直線(超平面)に全く影響を与えない.
つまり,最適解に影響はない.
ww b重み(n次元実数ベクトル) バイアス(スカラー)
線形学習マシンの数学:ハードマージン
14. 点と直線の距離 (2次元Ver)
(x1, x2)
d d =
|w1x1 + w2x2 + b|
w2
1 + w2
2
wT
xi + b = 0wT
xi
点と超平面の距離 (n次元Ver)
(x1, x2, ⋯, xn)
d =
|w1x1 + w2x2 + ⋯ + wnxn + b|
w2
1 + w2
2 + ⋯ + w2
n
n次元かけないけど,
3次元的に,,,wT
xi + b = 0wT
xi
d
=
|wT
x + b|
||w||w
wT
x 一般化する
は,重みベクトルのノルム(長さ)を表す||w||w
n次元データ
2次元平面の
点と直線の距離
高校数学だね
線形学習マシンの数学:ハードマージン
15. 特徴量 1
特徴量2
サポートベクトル
サポートベクトル
マージン最大化
(矢印部の長さ)
wT
x + b = 0
K2
K1
2つのクラスを分ける超平面に最も近いデータ(サポートベクトル)への距離を考える
wT
x
M =
wT
x+ + b
||w||
=
−(wT
x− + b)
||w||w
wT
x
x+
x−
x
x
w
wT
x
サポートベクトル サポートベクトル
ti(wT
xi + b)
||w||
≥ MmaxM,
w, bw (i = 1,2,⋯, n)
wT
xi
w
この最適化問題を解く
①サポートベクトル( or )
に対してマージン最大化する
②全てのベクトル が
そのマージンよりも距離が長い
この2つの条件を満たす
xixix+x+ x−x−
線形学習マシンの数学:ハードマージン
16. ti(wT
xi + b)
||w||
≥ MmaxM,
w, bw (i = 1,2,⋯, n)
wT
xi
w
この最適化問題を解く
関数出力として測定される関数マージンMが変化するので,
幾何マージンを最適化するためにも,関数マージンを1にする.
その後,重みベクトルのノルムを最大化(最小化)する
M =
wT
x+ + b
||w||
=
−(wT
x− + b)
||w||w
wT
x
w
wT
x
サポートベクトル サポートベクトル
wT
x + b = 1w
ここで,両辺をMで割る
ti(wT
xi + b)
M||w||
≥ 1
ti( ˜wT
xi + ˜b) ≥ 1
˜w =
w
M||w||
˜b =
b
M||w||
全てのデータに対して,この不等式がなりたつ
wT
xi
w
wT
xi
w
w
簡単のためチルダで表しておく
˜M =
ti( ˜wT
xi + ˜b)
|| ˜w||
=
1
|| ˜w||
サポートベクトル( x+ や x- )においては,
以下の等号が成立する
wT
xi
w w
(目的関数)
(制約条件)
ti( ˜wT
xi + ˜b) = 1wT
xi
特にサポートベクトルでは等号が成立
線形学習マシンの数学:ハードマージン
17. max
1
|| ˜w||
,
˜w, bw
(i = 1,2,⋯, n)ti( ˜wT
xi + ˜b) ≥ 1wT
xi
w
min
1
2
||w||2
, ti(wT
xi + b) ≥ 1wT
xi (i = 1,2,⋯, n)
w, bw
最大化は,逆数をとって最小化するのと等価である
最大化 → 最小化問題
w
(ノルムの二乗や1/2は計算を行いやすくするため!)
(目的関数) (制約条件)
最適化問題の最適解を求めると,
wT
x + b = 1w
ti( ˜wT
xi + ˜b) = 1wT
xi
は通常いくつか現れる.
これは,分類境界に最も近いベクトルであり,左図の破線上
の点に相当する
線形学習マシンの数学:ハードマージン
18. 特徴量 1
特徴量2
wT
x + b = 0
線形分離可能
K2
K1
特徴量 1特徴量2
K2
K1
線形分離不可能
wT
x + b = 0
ハードマージン ソフトマージン
ハードマージンよりも賢明なSVM
ハードマージンの持つ制約条件の緩和
SVMの取っ掛かりに良い
線形学習マシンの数学:ソフトマージン
19. K2
K1
線形分離不可能
wT
x + b = 0
wT
x + b = − 1
wT
x + b = 1
ti(wT
xi + b) ≥ 1 − ξiwT
xi
K1において分離する直線の
一番近いデータ(サポートベクトル)
K2において一番近いデータ
(サポートベクトル)
w, bw
線形分離可能な場合(ハードマージン)は,これの最小化問題を解くことが必要だった
min
1
2
||w||2
, ti(wT
xi + b) ≥ 1wT
xi (i = 1,2,⋯, n)w
等号が成立する場合
マージン
マージン内部に異なるデータが
入り込んでしまう
スラッグ変数 ξ を導入して制約を弱める
ξi = max
{
0, M −
ti(wT
xi + b)
||w|| }
(スラッグ変数 ξ はmax関数)
wT
x
w
w x
w x
w x
グ
ザ
イ
線形学習マシンの数学:ソフトマージン
20. ξi = max
{
0, (1 − 0.4 = 0.6)
}
ξi = max
{
0, M −
ti(wT
xi + b)
||w|| }
wT
x
w
K2
K1
具体例を考える
wT
x + b = 0
wT
x + b = 1
マージン M
例えば,この入り込んだ
データ(点)を考える
ti(wT
xi + b)
||w||
= 0.4直線と点の距離
マージン M = 1
ξi = 0.6
ti(wT
xi + b) ≥ 1 − ξi = 0.4wT
xi
この入り込んだデータ(点)に対しては,制約が小さくなる
w x
w x
上の具体例のように,マージンを超えてしまった点の存在を許可するためのもの
これによって,分離不可能な場合も境界の推定を可能にしている
線形学習マシンの数学:ソフトマージン
21. ti(wT
xi + b) ≥ 1wT
xi (i = 1,2,⋯, n)
ハードマージン
min
1
2
||w||2
w, bw
w
目的関数 制約条件
ソフトマージン
min
{
1
2
||w||2
+ C
n
∑
i=1
ξi}w, b, ξw
w
目的関数 制約条件
ti(wT
xi + b) ≥ 1 − ξi,wT
xi
(i = 1,2,⋯, n)
ξi ≥ 0
C > 0:正則化係数(ペナルティの度合い)
目的関数を最小化するためには,2項のバランスを上手く取らないといけない
マージンを広げようとすると,C
n
∑
i=1
ξi の部分( ξ の総和)が大きくなるため
1よりも小さくなるので,
マージンを超えて異なるクラスに入るのを許す
マージンを広げると,第一項は小さくなるが,第二項は大きくなっていく
線形学習マシンの数学:ソフトマージン
33. L(w, b, ξ, α, β) =
1
2
||w||2
+ C
n
∑
i=1
ξi −
n
∑
i=1
αi{ti(wT
xi + b) − 1 + ξi} −
n
∑
i=1
βiξiwT
xiww
max
{
˜L(α) =
n
∑
i=1
αi −
1
2
n
∑
i=1
n
∑
i=j
αiαjtitjxT
i xj}
xT
i xj
ラグランジュ関数
max
{
˜L(α) =
n
∑
i=1
αi −
1
2
n
∑
i=1
n
∑
i=j
αiαjtitjϕ(x)T
i ϕ(x)j}
ϕ(x)T
i ϕ(x)j
特徴空間上への拡張
ϕ(x) = (ϕ1(x), ϕ2(x), ⋯, ϕr(x))x x x x
内積のみのお話
問題:次元拡張により,内積の計算量が膨大
ϕ(x)T
i ϕ(x)jϕ(x)T
i ϕ(x)j
特徴空間の次元数 r は,もともとの入力空間の n よりもはるかに大きい
そのため,内積 の計算がとても大変
ϕ(x)T
i ϕ(x)jK(xi, xj) = ϕ(x)T
i ϕ(x)jxi, xj
カーネル関数
特徴ベクトルの内積をカーネル関数で置き換える
(言い換えると,内積の計算さえできればおk)
特徴空間への写像,カーネルの導入