バネ・マス・ダンパ系(右図)を例にします。
運動方程式:
(この運動方程式は2階の微分方程式)
ここで、とおくと、
となります。書き換えると
さらに、行列表記にすると、
となります。ここで、
とおくと、
という形で表記できます。
この行列ベクトル形式で表示したシステムの方程式を 状態方程式 、ベクトルを 状態変数 といいます。
こういったシステムを実際に作り、観測するとき、必ずしもすべての状態変数が見えるわけでもなく、また単独で見えないこともあります。これを一般的に表記すると、
と書けます。前半は状態変数が出力にどう出てくるかを示し、後半は入力が観測値に漏れてくる量です(一般にはあまりありませんが、そういうことも想定しておきます)。この方程式を 出力方程式 と呼びます。
例:上の例で位置が見える場合
一般的なシステムの伝達関数をsの分数式で表します。
(だたし、重解を考えない)
(λ:極)
ここで、
とおくと、
逆ラプラス変換すると、
一方、
なので、合わせると、
となります。これにより、伝達関数が状態方程式に変換できました。
※という形になっても、状態方程式にはできますが、これは後半に純粋な微分を含むため、実在のシステムでは普通はありません。
1入力1出力のn次システムの状態方程式、
の個々の微分方程式をそのまま, xi(0)=0でラプラス変換します。
※
上段の式を変形します。
これを下段の式に代入します。
となります。これにより、状態方程式で表されたシステムが、伝達関数に変換されました。
※
※出力方程式に「+du」があった場合、変形過程に付け加えていくと、伝達関数で単に「+d」になります。
ここでは、状態変数の選び方を変えることを考えます。
ごく単純には、たとえば、運動方程式の座標をメートル単位で記述していたものをミリ単位にすると値は1000倍になりますが、そのとき方程式はどうかわるか、2次元運動するものを(x,y)で記述していたけど、座標軸の向きを変えてみたくなった(回転)などで、どう変わるか、という問題です(平行移動とかは含まれませんが..)。
具体的には、
で表されるような変換を考えます。ここで、n次正方行列Tは逆行列がある=正則であるとします。
Tは定数行列なので、
であり、1入力1出力のシステム
に単に代入すると、
上段の式に左からTの逆行列をかけると、
となります。ここで、
と置き換えを行うと、
と、一般的な状態方程式の形になります。つまり、正則な行列Tをつかって、状態変数を扱いやすいように変換することができます。
ここで、この変換後のシステムの伝達関数を求めてみます。
これは、Tによる変換で、伝達関数が変わらないことを意味します。同じシステムで、変数の取り方を変えても、その物理特性が変わるはずはないので、当たり前と言えば当たり前ですが、数学的に確認できました。
このように、解析をしやすくするために状態変数を置き換えることができます。
状態方程式の行列Aに対して、
, 特性方程式
の解である固有値λiに対応する固有ベクトル v iを用いた座標変換、
を用いると、固有ベクトルと対角化の関係により、
と変換されます。これは状態方程式が、
という形になることを意味します。
(伝達関数を状態方程式にしたときも同形であることを思いだしませう)。
この時、状態方程式部分については、個々の式にばらしてみると
と、各状態変数が独立した微分方程式になっています。これは、連立の微分方程式を解く必要もなく、個々の状態変数ごとに解析的に結果を求めることが簡単であることを意味します。
この形を標準系状態方程式、もしくは対角正準系、と呼びます。
なお、固有ベクトルの選び方(個々の固有ベクトルの長さ)でbiをすべて1にすることもできます。
この方程式
を解いてみます。→制御工学Iの教科書のどこか
まず、ラプラス変換。
ラプラス逆変換して、
を得ます。
このλによってz(t)の挙動は大きく変わります。
λの実部が0未満:安定(たとえば初期値がどんどん0に向う)
λの実部が0以上:不安定(発振、発散)
ちなみに、λの虚部によって、振動的かどうか、その程度が決まります。
結論としては、システムの行列Aの固有値は、そのシステムの安定性をみる上で非常に重要である、ということがわかりました。また、システムの中の個々の特徴も直接的に見える数値です。
補足:座標変換と特性方程式
座標変換したシステムの特性方程式を計算してみます。
となるため、変数の取り方によって普遍です(直感的に当たり前)。
これまで、制御工学で題材としてきたシステムのほとんどは、入力を与えると物理的に反応があり、結果が検出できることになっていました。しかし、一般的なシステムを考えた場合、必ずしも制御できるとは限りませんし、対象の状態が必ずしも見えるとは限りません。また、一見すると、直接的には操作、観察できない状態であっても、間接的に操作、観察ができるかもしれません。
そういった状況をここでは取り扱います。
例1:
システム
において、bi、ciについて考える。
aの場合では、とりあえず0には近づくため、システム全体としては安定といえるが、もし、制御できるならばより早く0に近づけるなどの特性改善が可能。bの場合は、発散するため、システムに有害。
例2:
制御 | 観測 | |
スイッチでON/OFFできる、室内の電球 | ○ | ○ |
スイッチでON/OFFできる、天井裏の電球 | ○ | × |
スイッチでON/OFFできない、室内の電球 | × | ○ |
スイッチでON/OFFできない、天井裏の電球 | × | × |
各状態変数がなんらかの方法で制御できることを「可制御」といいます。
定義:
任意の初期状態から、与えられた状態
へ、何らかの入力
によって、移すことができる
→可制御である / controllable
判定法:
に対して、行列
の階数(rank)がnである→「可制御」、「(A、B)は可制御」
一方、rankがn未満であると、不可制御。
各状態変数がなんらかの方法で検出できることを「可観測」といいます。
定義:
出力と入力
を0≦t≦tfの期間、観測することで
を求めることができる
→可観測である / observable
判定法:
に対して、行列
のrankがnである→「可観測」「(C、A)は可観測」
可観測性の判定行列
を転置してみます。
これを可制御性の判定行列と見比べてみると、同じ形をしていることが分かります。
(C,A)が可観測←→(AT,CT)が可制御
(A,B)が可制御←→(BT,AT)が可観測
これを双対性といいます。
(あまり、普段はつかいませんが理論証明などで使うことあり)
システム
の可制御性、可観測性を調べます。
可制御性:
この行列の1行目と3行目を入れ替えると、
となるため、rank=2、よって可制御ではありません。
可観測性:
rankを求めます。
※2行目−1行目×2,3行目−1行目×3、3行目−2行目
rank=3なので、このシステムは可観測です。
別の直感的見方:
状態方程式の、Aに関わる部分だけを見ると、
x1は、x1によって変化する
x2は、x3によって変化する
x3は、x1,x2,x3によって変化する
となっています。入力uはx3に変化を与えるため、x3は直接、x2はx3を経由して変化しますが、x1には何の影響もありません。そう考えると、可制御でなさそうです。
一方、出力はx1とx3が混じっていますので、これらは直接観測されます。x2については、x3を経由して変化が見えると言えます。全部見えるので可観測と考えられます。