nechť a∈R∗, nechť funkce f,g:P(a,δ)→R mají na P(a,δ) vlastní derivaci a nechť g′(x)=0 na P(a,δ)
pokud limx→af(x)=limx→ag(x)=0 a limx→af′(x)/g′(x)=A∈R∗, pak i limx→af(x)/g(x)=A
pokud limx→a∣g(x)∣=+∞ a limx→af′(x)/g′(x)=A∈R∗, pak i limx→af(x)/g(x)=A
Vyšetření průběhu funkcí: extrémy, monotonie a konvexita/konkavita
extrémy
pokud má funkce f v bodě a nenulovou derivaci f′(a)=0, pak f v a nenabývá lokální extrém
tedy pokud má f lokální extrém bodě a, tak buď f′(a)=0, nebo f′(a) neexistuje
pozor, funkce může mít globální extrém v krajním bodě uzavřeného intervalu
monotonie
uvažujeme interval s kladnou délkou a spojitou funkci f s derivací v každém vnitřním bodě intervalu
pokud na vnitřku intervalu platí f′>0, je f na daném intervalu rostoucí
pokud f′≥0, pak je neklesající
pokud f′<0, pak je klesající
pokud f′≤0, pak je nerostoucí
pokud f′=0, pak je konstantní
konvexita/konkavita
zjednodušená definice: funkce f je na intervalu (a,b) konvexní, pokud graf funkce na intervalu (a,b) leží pod úsečkou spojující body (a,f(a)) a (b,f(b))
respektive pokud leží pod nebo na úsečce, tak je konvexní, pokud leží ostře pod úsečkou, tak je ryze konvexní
podobně konkávnost
pokud je druhá derivace funkce kladná, je ryze konvexní (pokud je nezáporná, je konvexní)
pokud je druhá derivace funkce záporná, je ryze konkávní (pokud je nekladná, je konkávní)
Taylorův polynom (limitní forma)
Taylorův polynom řádu n funkce f v bodě a: Tnf,a(x)=i=0∑ni!f(i)(a)(x−a)i
poznámka: nultý člen součtu bude vždy f(a)
má-li funkce f v bodě a∈R derivace všech řádů, rozumíme pro x∈R její taylorovou řadou se středem v a řadu Tf,a(x)=n=0∑∞n!f(n)(a)(x−a)n
součet Taylorovy řady je f(x)
Primitivní funkce: definice a metody výpočtu (substituce, per-partes)
nechť −∞≤a<b≤+∞ a f:(a,b)→R je daná funkce
pokud má funkce F:(a,b)→R na (a,b) derivaci a ta se rovná f(x), řekneme, že F je na intervalu (a,b) primitivní funkcí k funkci f
primitivní funkce je jednoznačná až na konstantu
Newtonův integrál funkce f na intervalu (a,b) definujeme jako (N)∫abf(x)dx:=[F]ab=F(b−)−F(a+)=x→b−limF(x)−x→a+limF(x)
poznámka: konstanta c se odečte
substituci a per-partes je nutné nastudovat (i pro určitý integrál)
vzorec pro per-partes: ∫u′v=uv−∫uv′
Riemannův integrál: definice, souvislost s primitivní funkcí (Newtonovým integrálem)
uvažujeme dělení D=(a0,a1,…,ak) intervalu [a,b]
tzn. a=a0<a1<a2<⋯<ak=b
definujeme dolní Riemannovu sumu s(f,D)=∑i=0k−1∣Ii∣mi
Ii=[ai,ai+1]
mi je supremum funkce f v intervalu Ii
také definujeme horní Riemannovu sumu S(f,D)=∑i=0k−1∣Ii∣Mi
Mi … infimum
dolní Riemannův integrál na intervalu [a,b] definujeme jako supremum z s(f,D) pro všechna dělení D intervalu [a,b]
značí se ∫abf
horní Riemannův integrál je infimum z S(f,D)
∫abf
funkce má Riemannův integrál, pokud se horní a dolní R. integrály rovnají (pak tuhle společnou hodnotu nazveme Riemannovým integrálem)
∫abf
základní věta analýzy: pokud Riemannův a Newtonův integrál existují, pak jsou si rovny
Aplikace integrálů: odhady součtu řad (konečných i nekonečných)
pro přirozené n a neklesající funkci f na intervalu [1,n] platí k=1∑n−1f(k)≤∫1nf≤k=2∑nf(k)
integrální kritérium konvergence
uvažujme nerostoucí nezápornou funkci f
řada ∑k=1∞f(k) konverguje ⟺limb→+∞∫1bf<+∞
přesný postup pro odhad součtu řady je potřeba nacvičit
Aplikace integrálů: obsahy rovinných útvarů
plocha rovinného útvaru U(a,b,f) pod grafem funkce f … ∫abf
Aplikace integrálů: objemy a povrchy rotačních útvarů v prostoru
V … rotační těleso vzniklé rotací rovinného útvaru U(a,b,f) pod grafem funkce f kolem osy x
objem(V)=π∫abf(t)2dt
povrch(V)=2π∫abf(t)1+(f′(t))2dt
Aplikace integrálů: délka křivky
uvažujeme křivku z bodu a do bodu b popsanou funkcí f
∫ab1+(f′(t))2dt
2. Algebra a lineární algebra
Grupy a podgrupy, permutace
binární operace na množině X je zobrazení X×X→X
neutrální prvek: (∃e∈G)(∀a∈G):a∘e=e∘a=a
inverzní prvek: (∀a∈G)(∃b∈G):a∘b=b∘a=e
grupa (G,∘) je množina G spolu s binární operací ∘ na G splňující asociativitu operace ∘, existenci neutrálního prvku a existenci inverzních prvků
pokud je navíc operace ∘ komutativní, pak se jedná o abelovskou grupu
grupa (H,∙) je podgrupou grupy (G,∘), pokud H⊆G a ∀a,b∈H:a∙b=a∘b
píšeme (H,∙)≤(G,∘)
permutace na množině {1,2,…,n} je bijektivní zobrazení p:{1,2,…,n}→{1,2,…,n}
skládání permutací … (q∘p)(i)=q(p(i))
permutační matice
(P)i,j={10pokud p(i)=jjinak
cyklus … např. (1,2,3,4)
odpovídá zobrazení, které mapuje 1→2, 2→3, 3→4, 4→1
transpozice … permutace, která má pouze jeden netriviální cyklus o délce 2, tedy např. (1,3)
jakoukoliv permutaci lze rozložit na transpozice
cyklus (1,2,3,4) lze rozložit na (1,4)∘(1,3)∘(1,2) nebo na (1,2)∘(2,3)∘(3,4)
znaménko permutace p je sgn(p)=(−1)pocˇet inverzıˊ vp
inverze v p je dvojice prvků (i,j):i<j∧p(i)>p(j)
nebo také sgn(p)=(−1)pocˇet transpozic vp
Tělesa a speciálně konečná tělesa
těleso je množina K spolu se dvěma komutativními binárními operacemi + a ⋅, kde (K,+) a (K∖{0},⋅) jsou abelovské grupy a navíc platí distributivita ∀a,b,c∈K:a⋅(b+c)=(a⋅b)+(a⋅c)
charakteristika tělesa
v tělese K, pokud ∃n∈N:n1+1+⋯+1=0, pak nejmenší takové n je charakteristika tělesa K
jinak má těleso K charakteristiku 0
značí se char(K)
lze dokázat, že u konečných těles musí být prvočíselná
Zp je těleso, právě když je p prvočíslo
ale existují i konečná tělesa s neprvočíselným řádem (počtem prvků) – např. Galois field GF(4)
řád musí být kladná celá mocnina prvočísla
Soustavy lineárních rovnic – maticový zápis, elementární řádkové úpravy, odstupňovaný tvar matice
maticový zápis soustavy rovnic
soustava m lineárních rovnic o n neznámých … Ax=b
rozšířená matice soustavy … (A∣b)∈Rm×(n+1)
matice soustavy … A∈Rm×n
vektor pravých stran … b∈Rm
vektor neznámých … x=(x1,…,xn)T
vektor x∈Rn je řešení soustavy Ax=b, pokud splňuje všechny její rovnice
soustavy Ax=0 se nazývají homogenní a vždy umožňují x=0
elementární řádkové operace
definujeme základní dvě elementární řádkové úpravy
vynásobení i-tého řádku nenulovým t∈R∖{0}
přičtení j-tého řádku k i-tému řádku
z těch lze odvodit další dvě úpravy
přičtení t-násobku j-tého řádku k i-tému řádku (t může být i nulové)
záměna dvou řádků
provedení jedné elementární úpravy značíme A∼A′
provedení posloupnosti úprav značíme A∼∼A′
elementárními úpravami soustavy (A∣b) se nemění množina řešení
odstupňovaný tvar matice
matice je v řádkově odstupňovaném tvaru (REF = row echelon form), pokud jsou nenulové řádky (ostře) seřazeny podle počtu počátečních nul a nulové řádky jsou pod nenulovými
k formální definici bychom zavedli notaci j(i) pro pozici prvního nenulového prvku v i-tém řádku
první nenulový prvek nenulového řádku se nazývá pivot, pod pivotem jsou v REF všechny prvky nulové
pro soustavu A′x=b′ s A′ v REF jsou proměnné odpovídající sloupcům s pivoty bázické, ostatní jsou volné
redukovaný odstupňovaný tvar (RREF)
pivoty jsou jednotkové
nad i pod pivoty jsou nuly
Gaussova a Gaussova-Jordanova eliminace, popis množiny řešení
Gaussova eliminace = převod do odstupňovaného tvaru pomocí elementárních úprav, to se dá popsat algoritmicky:
seřadíme řádky podle počtu počátečních nul
najdeme první dva řádky, co mají stejně počátečních nul
od toho druhého (a všech dalších, co mají stejně nul) odečteme vhodný násobek toho prvního, abychom mu první nenulu vynulovali
tohle opakujeme, dokud se nedostaneme do REF
Gaussova-Jordanova eliminace = převod do RREF
z pivotů se jedničky dělají snadno – stačí řádek vydělit pivotem
nad pivoty se jedničky také dostávají snadno – stačí od řádku odečíst vhodný násobek řádku s pivotem v daném sloupci (dává smysl postupovat odspodu)
množina řešení
pokud je pivot v posledním sloupci rozšířené matice soustavy, soustava rovnic nemá řešení
existuje bijekce xˉ↦xˉ+x0 mezi množinami {xˉ:Axˉ=0} a {x:Ax=b}
pokud x0 splňuje Ax0=b
množinu řešení soustavy Ax=b popíšeme jako x=y+p1x1+p2x2+⋯+pn−rxn−r
y … libovolné řešení soustavy Ax=b
u homogenní soustavy to typicky bude nulový vektor
je to člen, který odpovídá tomu x0 výše
pixi
takový člen tam bude za každou volnou proměnnou (bude jich n−r, tedy počet řádků – hodnost matice)
pi je libovolný reálný parametr
tyhle členy můžeme získat tak, že řešíme soustavu Ax=0 a řešení vyjádříme pomocí parametrů (a pak je vytkneme)
nebo je lze vyčíst z RREF matice
ve vektoru xi bude typicky jednička na místě odpovídající volné proměnné a nuly u všech ostatních volných proměnných (protože je to vlastně složka, která se stará o konkrétní volnou proměnnou)
Operace s maticemi a základní typy matic, hodnost matice
hodnost matice
hodnost matice A, značená jako rank(A), je počet pivotů v libovolné A' v REF takové, že A∼∼A′
jednotková matice
pro n∈N je jednotková matice In∈Rn×n definovaná tak, že (In)i,j=1⟺i=j, ostatní prvky jsou nulové
transponovaná matice
transponovaná matice k matici A∈Rm×n je matice AT∈Rn×m splňující (AT)i,j=aj,i
symetrická matice
čtvercová matice A je symetrická, pokud AT=A, tedy ai,j=aj,i
maticový součin
pro A∈Rm×n,B∈Rn×p je součin (AB)∈Rm×p definován (AB)i,j=∑k=1nai,kbk,j
Regulární a inverzní matice
inverzní matice
pokud pro čtvercovou matici A∈Rn×n existuje B∈Rn×n taková, že AB=In, pak se B nazývá inverzní matice a značí se A−1
výpočet: (A∣In)∼∼(In∣A−1)
regulární/singulární matice
pokud má matice A inverzi, pak se nazývá regulární, jinak je singulární
věta: pro čtvercovou matici A∈Rn×n jsou následující podmínky ekvivalentní
matice A je regulární, tedy k ní existuje inverzní matice … ∃B:AB=In
rank(A)=n
A∼∼In
systém Ax=0 má pouze triviální řešení x=0
inverzní matici k matici A lze najít pomocí Gaussovy-Jordanovy eliminace (A∣In)∼∼(In∣A−1)
pokud tento proces selže, tak je A singulární
Vektorový prostor, lineární kombinace, lineární závislost a nezávislost, lineární obal, systém generátorů
vektorový prostor
vektorový prostor (V,+,⋅) nad tělesem (K,+,⋅) je množina spolu s binární operací + na V a binární operací skalárního násobku ⋅:K×V→V
(V,+) je abelovská grupa
∀α,β∈K,∀u,v∈V
asociativita … (α⋅β)⋅u=α⋅(β⋅u)
neutrální prvek (skalár) vůči násobení skalárem … 1⋅u=u
distributivita … (α+β)⋅u=(α⋅u)+(β⋅u)
distributivita … α⋅(u+v)=(α⋅u)+(α⋅v)
prvky K se nazývají skaláry, prvky V vektory
rozlišujeme nulový skalár 0 a nulový vektor o
podprostor vektorového prostoru
nechť V je vektorový prostor na K, potom podprostor U je neprázdná podmnožina V splňující uzavřenost na součet vektorů a uzavřenost na násobení skalárem (z K) – z toho nutně vyplývá o∈U
lineární kombinace
lineární kombinace vektorů v1,…,vk∈V nad K je libovolný vektor u=α1v1+⋯+αkvk, kde α1,…,αk∈K
lineárně nezávislé vektory
množina vektorů X je lineárně nezávislá, pokud nulový vektor nelze získat netriviální lineární kombinací vektorů z X; v ostatních případech je množina X lineárně závislá
vektory v1,…,vn jsou lineárně nezávislé ≡∑i=1nαivi=o⟺α1=⋯=αn=0
lineární obal (podprostor generovaný množinou)
lineární obal L(X) podmnožiny X vektorového prostoru V je průnik všech podprostorů U z V, které obsahují X
alternativní značení: span(X)
pro X⊆V platí span(X)=⋂U:U⋐V,X⊆U
jde o podprostor generovaný X, vektory v množině X se označují jako generátory podprostoru
věta: průnik podprostorů je taky podprostor
věta: L(X) je množina všech lineárních kombinací vektorů z X
Steinitzova věta o výměně, báze, dimenze, souřadnice
lemma o výměně
buď y1,…,yn systém generátorů vektorového prostoru V
nechť vektor x∈V má vyjádření x=∑i=1nαiyi
pak pro libovolné k takové, že αk=0, je y1,…,yk−1,x,yk+1,…,yn systém generátorů prostoru V
Steinitzova věta o výměně
buď V vektorový prostor
buď x1,…,xm lineárně nezávislý systém ve V
nechť y1,…,yn je systém generátorů V
pak platí m≤n a existují navzájem různé indexy k1,…,kn−m takové, že x1,…,xm,yk1,…,ykn−m tvoří systém generátorů V
báze vektorového prostoru
báze vektorového prostoru V je lineárně nezávislá množina X, která generuje V (tedy span(X)=V)
dimenze vektorového prostoru
dimenze konečně generovaného vektorového prostoru V je mohutnost (kardinalita / počet prvků) kterékoli z jeho bází; značí se dim(V)
vektor souřadnic
nechť X=(v1,…,vn) je uspořádaná báze vektorového prostoru V nad K, potom vektor souřadnic u∈V vzhledem k bázi X je [u]x=(α1,…,αn)T∈Kn, kde u=∑i=1nαivi
Vektorové podprostory, zejména maticové (řádkový, sloupcový, jádro) a jejich dimenze
řádkový a sloupcový prostor matice A∈Km×n
sloupcový prostor S(A)⊆Km je lineární obal sloupců A
řádkový prostor R(A)⊆Kn je lineární obal řádků A
S(A)={u∈Km:u=Ax,x∈Kn}
R(A)={v∈Kn:v=ATy,y∈Km}
jádro matice A∈Km×n
ker(A)={x∈Kn:Ax=0}
věta: ∀A∈Km×n:dim(ker(A))+rank(A)=n
pozorování: dimenze řádkového a sloupcového prostoru se shodují (a rovnají se hodnosti)
nechť U a V jsou vektorové prostory nad stejným tělesem K
zobrazení f:U→V nazveme lineární, pokud splňuje ∀u,v∈U,∀α∈K:
f(u+v)=f(u)+f(v)
f(α⋅u)=α⋅f(u)
z toho vyplývá, že pro lineární zobrazení obecně platí f(o)=o
věta: lineární zobrazení je jednoznačně definováno tím, kam zobrazí vektory báze (proto můžeme definovat matici lineárního zobrazení)
matice lineárního zobrazení
nechť U a V jsou vektorové prostory nad stejným tělesem K s bázemi X=(u1,…,un) a Y=(v1,…,vm)
matice lineárního zobrazení f:U→V vzhledem k bázím X a Y je [f]X,Y∈Km×n, jejíž sloupce jsou vektory souřadnic obrazů vektorů báze X vzhledem k bázi Y, tedy [f(u1)]Y,…,[f(un)]Y
pro w∈U tedy platí, že [f(w)]Y=[f]X,Y[w]X
matice složeného zobrazení
mějme vektorové prostory U,V,W s konečnými uspořádanými bázemi B,C,D
pro matice lineárních zobrazení f:U→V a g:V→W platí vztah [g∘f]B,D=[g]C,D[f]B,C
je to hezčí, když použijeme Hladíkovo značení: D[g∘f]B=D[g]C⋅C[f]B
matice přechodu
nechť X a Y jsou dvě konečné báze vektorového prostoru U
matice přechodu od X k Y je [id]X,Y
pro u∈U tedy platí, že [u]Y=[id(u)]Y=[id]X,Y[u]X
matice přechodu je regulární, platí [id]Y,X=([id]X,Y)−1
výpočet: [id]X,Y=Y−1X nebo také (Y∣X)∼∼(In∣[id]X,Y)
Obraz a jádro lineárních zobrazení
nechť U a V jsou vektorové prostory nad stejným tělesem K
jádro lineárního zobrazení
ker(f)={w∈U:f(w)=o}
vektory v prostoru U, které se zobrazí na nulový vektor v prostoru V
obraz f(U) podprostoru U je podprostorem V
Isomorfismus prostorů
vektorové prostory jsou isomorfní, pokud mezi nimi existuje isomorfismus, tedy bijektivní (vzájemně jednoznačné) lineární zobrazení
pro isomorfismus f platí, že existuje f−1 a je také isomorfismem
isomorfní prostory mají shodné dimenze
věta: f je isomorfismus, právě když [f]X,Y je regulární
skalární součin pro vektorové prostory nad komplexními čísly
skalární součin na vektorovém prostoru V nad C je zobrazení, které přiřadí každé dvojici vektorů u,v∈V skalár ⟨u∣v⟩∈C tak, že jsou splněny následující axiomy:
∀u∈V:⟨u∣u⟩∈R0+ (reálné číslo ≥0)
∀u∈V:⟨u∣u⟩=0⟺u=0
∀u,v∈V:⟨v∣u⟩=⟨u∣v⟩ (komplexně sdružené)
∀u,v,w∈V:⟨u+v∣w⟩=⟨u∣w⟩+⟨v∣w⟩
∀u,v∈V,∀α∈C:⟨αu∣v⟩=α⟨u∣v⟩
formálně je každý skalární součin zobrazení V×V→C
skalární součin na V nad R je zobrazení V×V→R, přičemž ⟨v∣u⟩=⟨u∣v⟩ (ve třetím axiomu), α∈R (v posledním axiomu)
standardní skalární součin na Rn: ⟨u∣v⟩=vTu
standardní skalární součin na Cn: ⟨u∣v⟩=vHu
norma spojená se skalárním součinem
je-li V prostor se skalárním součinem, pak norma odvozená ze skalárního součinu je zobrazení V→R0+ přiřazující vektoru u jeho normu ∥u∥=⟨u∣u⟩
geometrická interpretace v euklidovském prostoru Rn
∥u∥ … délka (velikost) u
∥u−v∥ … vzdálenost bodů u,v
⟨u∣v⟩ souvisí s „úhlem“ φ mezi u,v a délkami u,v
⟨u∣v⟩=∥u∥⋅∥v∥cosφ
to vyplývá z kosinové věty, kde a=∥u∥,b=∥v∥,c=∥u−v∥
kolmé vektory
vektory u,v z prostoru se skalárním součinem jsou kolmé (ortogonální), pokud ⟨u∣v⟩=0
ovšem taky platí ∥a+b∥2=∥a∥2+∥b∥2, rovněž pro kolmé a,b
Cauchy-Schwarz: ∣⟨u∣v⟩∣≤⟨u∣u⟩⟨v∣v⟩
trojúhelníková nerovnost: ∥u+v∥≤∥u∥+∥v∥
Ortonormální systémy vektorů, Fourierovy koeficienty, Gramova-Schmidtova ortogonalizace
ortonormální báze
bázi Z={v1,…,vn} prostoru V se skalárním součinem nazveme ortonormální, pokud platí vi⊥vj pro každé i=j a také ∣∣vi∣∣=1 pro každé vi∈Z
pozorování: matice, jejichž sloupce tvoří vektory ortonormální báze Cn vzhledem ke std. skal. součinu, splňují AHA=In⟹ jsou unitární
Fourierovy koeficienty
nechť Z={v1,…,vn} je ortonormální báze prostoru V
tvrzení: pro každé u∈V platí u=⟨u∣v1⟩v1+⋯+⟨u∣vn⟩vn
⟨u∣vi⟩ … Fourierovy koeficienty
algoritmus GS ortogonalizace
převede libovolnou bázi (u1,…,un) prostoru V se skalárním součinem na ortonormální bázi (v1,…,vn)
for i=1,…,n do
wi←ui−∑j=1i−1⟨ui∣vj⟩vj
vi←∣∣wi∣∣1wi
end
Ortogonální doplněk, ortogonální projekce, projekce jako lineární zobrazení
ortogonální doplněk
ortogonální doplněk podmnožiny V prostoru se skalárním součinem W je V⊥={u∈W∣∀v∈V:u⊥v}
ortogonální projekce
nechť W je prostor se skalárním součinem a V je jeho podprostor s ortonormální bází Z=(v1,…,vn)
zobrazení pZ:W→V definované pZ(u)=∑i=1n⟨u∣vi⟩vi je ortogonální (kolmá) projekce W na V
pozorování: ortogonální projekce je lineární zobrazení
Ortogonální matice a jejich vlastnosti
matice Q∈Rn×n je ortogonální, pokud QTQ=In
věta: Q je ortogonální, právě když sloupce tvoří ortogonální bázi Rn
tvrzení: je-li Q ortogonální, pak…
QT je rovněž ortogonální
Q−1 existuje a je ortogonální
součin ortogonálních matic je ortogonální matice
další vlastnosti
⟨Qx∣Qy⟩=⟨x∣y⟩
∥Qx∥=∥x∥
zobrazení x↦Qx zachovává úhly a délky
platí to i naopak – matice zobrazení zachovávajícího skalární součin je ortogonální
∀i,j:∣Qij∣≤1
(1ooTQ) je ortogonální matice
Definice a základní vlastnosti determinantu (multiplikativnost, determinant transponované matice, vztah s regularitou a vlastními čísly)
determinant matice A∈Kn×n je dán výrazem det A=p∈Sn∑sgn(p)i=1∏nai,p(i)
věta: ∀A,B∈Kn×n:det(AB)=det A⋅det B
transpozice nemění determinant, detA=detAT
matice je regulární, právě když má nenulový determinant
pro regulární matici A platí det(A−1)=det(A)−1
výpočet determinantu je nutné nastudovat
det(A)=λ1⋅λ2⋅…⋅λn
λ je vlastním číslem A, právě když det(A−λIn)=0
tedy právě když je kořenem charakteristického polynomu pA(t)=det(A−tIn)
Laplaceův rozvoj determinantu
notace: Aij je podmatice získaná z A odstraněním i-tého řádku a j-tého sloupce
věta: pro libovolné A∈Kn×n a jakékoli i∈{1,…,n} platí det A=j=1∑naij(−1)i+j det Aij
Geometrická interpretace determinantu
objem rovnoběžnostěnu určeného k vektory je roven absolutní hodnotě determinantu matice, jejíž sloupce tyto vektory tvoří
po provedení lineárního zobrazení se objemy těles změní úměrně absolutní hodnotě determinantu matice zobrazení
Definice, geometrický význam a základní vlastnosti vlastních čísel, charakteristický polynom, násobnost vlastních čísel
definice
mějme matici A∈Cn×n
vlastní číslo matice A je jakékoliv λ∈C, pro které existuje vektor x∈Cn∖{o} takový, že Ax=λx
x je pak vlastní vektor příslušný vlastnímu číslu λ
geometrie
vlastní vektor reprezentuje invariantní směr při zobrazení x↦Ax, tedy směr, který se zobrazí opět na ten samý směr
vlastní číslo odpovídá škálování v tomto invariantním směru
základní vlastnosti
determinant matice je roven součinu vlastních čísel
stopa matice (součet diagonály) je roven součtu vlastních čísel
matice je regulární, právě když nula není její vlastní číslo
AT má stejná vlastní čísla jako A, ale vlastní vektory obecně jiné
uvažujeme matici A∈Cn×n s vlastními čísly λ1,…,λn a jim odpovídajícími vlastními vektory x1,…,xn
je-li A regulární, pak A−1 má vlastní čísla λ1−1,…,λn−1 a vlastní vektory x1,…,xn
A2 má vlastní čísla λ12,…,λn2 a vlastní vektory x1,…,xn
podobně pro αA a taky pro A+αIn
charakteristický polynom … pA(t)=det(A−tIn)
vlastní čísla matice A jsou právě kořeny jejího charakteristického polynomu a je jich n včetně násobností
algebraická násobnost λ je rovna násobnosti λ jakožto kořene pA
geometrická násobnost λ je rovna n−rank(A−λIn), tj. počtu lineárně nezávislých vlastních vektorů, které odpovídají λ
algebraická násobnost ≥ geometrická násobnost
obvykle se násobností myslí ta algebraická
Podobnost a diagonalizovatelnost matic, spektrální rozklad
matice A,B∈Cn×n jsou podobné, pokud existuje regulární S∈Cn×n tak, že A=SBS−1
věta: podobné matice mají stejná vlastní čísla
počet vlastních vektorů pro konkrétní vlastní číslo je stejný u obou matic
matice A∈Cn×n je diagonalizovatelná, je-li podobná nějaké diagonální matici
diagonalizovatelná matice A jde tedy vyjádřit ve tvaru A=SΛS−1, kde S je regulární a Λ diagonální
tomuto se říká spektrální rozklad
sloupce matice S odpovídají vlastním vektorům (v pořadí, v němž jsou vlastní čísla na diagonále Λ)
věta: matice A∈Cn×n je diagonalizovatelná, právě když má n lineárně nezávislých vlastních vektorů
věta: pokud má matice n navzájem různých vlastních čísel, pak je diagonalizovatelná
A2=SΛ2S−1
Symetrické matice, jejich vlastní čísla a spektrální rozklad
matice je symetrická, pokud A=AT
vlastní čísla reálných symetrických matic jsou reálná
věta: pro každou symetrickou matici A∈Rn×n existuje ortogonální Q∈Rn×n a diagonální Λ∈Rn×n takové, že A=QΛQT
Positivně semidefinitní a positivně definitní matice – charakterizace a vlastnosti, vztah se skalárním součinem, vlastními čísly
definice
buď A∈Rn×n symetrická
pak A je positivně semidefinitní, pokud xTAx≥0 pro všechna x∈Rn
A je positivně definitní, pokud xTAx>0 pro všechna x=o
poznámka: nesymetrické matice můžeme symetrizovat úpravou 21(A+AT)
následující tří vlastnosti jsou ekvivalentní
A je positivně semidefinitní (nebo definitní)
vlastní čísla A jsou nezáporná
pro definitní musí být kladná
existuje matice U∈Rm×n taková, že A=UTU
pro definitní musí mít matice U hodnost n
vlastnosti
jsou-li A,B positivně definitní, pak i A+B je p. d.
je-li A positivně definitní a α>0, pak i αA je p. d.
je-li A positivně definitní, pak je regulární a A−1 je p. d.
operace ⟨x∣y⟩ je skalárním součinem v Rn, právě když má tvar ⟨x∣y⟩=xTAy pro nějakou positivně definitní matici A∈Rn×n
testování p. d. pomocí Gaussovy eliminace
používáme pouze úpravu přičtení násobku řádku s pivotem k jinému řádku pod ním
pokud nám vyjde odstupňovaný tvar s kladnou diagonálou, byla původní matice positivně definitní
Choleského rozklad (znění věty a praktické použití)
pro každou positivně definitní matici A∈Rn×n existuje jediná dolní trojúhelníková matice L∈Rn×n s kladnou diagonálou taková, že A=LLT
algoritmus vypadá složitě, ale dá se to vymyslet intuitivně (je vhodné začít tím, že první prvek matice A je druhou mocninou čísla, které je v obou trojúhelníkových maticích vlevo nahoře)
praktické použití
řešíme soustavu Ax=b
máme Choleského rozklad A=LLT
snadno najdeme řešení soustavy Ly=b (díky nulám v trojúhelníkové matici stačí substituovat)
pak najdeme řešení soustavy LTx=y
proč to funguje?
L(=yLTx)=b
3. Diskrétní matematika
Relace, vlastnosti binárních relací (reflexivita, symetrie, antisymetrie, tranzitivita)
(binární) relace mezi množinami X,Y je podmnožina X×Y
relace na množině X je podmnožina X2
značení – pro relaci R mezi X,Y:xRy≡(x,y)∈R
příklady relací
prázdná ∅
univerzální X×Y
diagonální ΔX:={(x,x)∣x∈X}, např. rovnost x=y
operace s relacemi
inverze
k relaci R mezi X,Y lze definovat inverzní relaci R−1 mezi Y,X, přičemž R−1:={(y,x)∣(x,y)∈R}
skládání
pro relaci R mezi X,Y a relaci S mezi Y,Z lze definovat složenou relaci T=R∘S mezi X,Z
xTz≡∃y∈Y:xRy∧ySz
R∘ΔY=R,ΔX∘R=R
značení skládání funkcí: (f∘g)(x)=g(f(x))
relace R na X je…
reflexivní ≡∀x∈X:xRx
ΔX⊆R
symetrická ≡∀x,y∈X:xRy⟹yRx
R=R−1
antisymetrická ≡∀x,y∈X:xRy∧yRx⟹x=y
R∩R−1⊆ΔX
tranzitivní ≡∀x,y,z∈X:xRy∧yRz⟹xRz
R∘R⊆R
Ekvivalence a rozkladové třídy
relace R na X je ekvivalence ≡R je reflexivní & symetrická & tranzitivní
např. rovnost čísel, rovnost mod K, geometrická podobnost
ekvivalenční třída prvku x∈X:R[x]={y∈X∣xRy}
množinový systém S⊆2X je rozklad množiny X≡
∀A∈S:A=∅
∀A,B∈S:A=B⟹A∩B=∅
⋃A∈SA=X
věta (vztah mezi ekvivalencemi a rozklady)
∀x∈X:R[x]=∅
∀x,y∈X: buď R[x]=R[y], nebo R[x]∩R[y]=∅
{R[x]∣x∈X} (množina všech ekvivalenčních tříd) určuje ekvivalenci R jednoznačně
Částečná uspořádání – základní pojmy (minimální a maximální prvky, nejmenší a největší prvky, řetězec, antiřetězec)
relace R na množině X je (částečné) uspořádání ≡R je reflexivní & antisymetrická & tranzitivní
(částečně) uspořádaná množina (X,R)
zkráceně ČUM
R je (částečné) uspořádání na X
prvky x,y∈X jsou porovnatelné ≡xRy∨yRx
uspořádání je lineární ≡∀x,y∈X porovnatelné
(všechny prvky množiny jsou navzájem porovnatelné)
částečné uspořádání (nebo pouze uspořádání) je obecný pojem, některá taková uspořádání jsou navíc lineární
ostré uspořádání – každému uspořádání ≤ na X přiřadíme relaci < na X: a<b≡a≤b∧a=b
pozor – ostré uspořádání není speciálním případem uspořádání (protože není reflexivní)
vlastnosti ostrého uspořádání – ireflexivní, antisymetrické, tranzitivní
Hasseův diagram graficky zachycuje vztahy mezi prvky ČUM (porovnatelné prvky jsou spojeny, větší prvky jsou výše)
prvek x∈X je nejmenší ≡∀y∈X:x≤y
prvek x∈X je minimální ≡∄y∈X:y<x
x je nejmenší ⟹x je minimální
v Hassově diagramu
z minimálního prvku dolů nevede žádná spojnice
nejmenší prvek je nejníž v diagramu, existuje do něj cesta z libovolného jiného prvku
věta: konečná neprázdná uspořádaná množina má minimální a maximální prvek
pro (X,≤) ČUM:
A⊆X je řetězec ≡∀a,b∈A:a,b jsou porovnatelné
A⊆X je antiřetězec (nezávislá množina) ≡∄a,b různé & porovnatelné
Výška a šířka částečně uspořádané množiny a věta o jejich vztahu (o dlouhém a širokém)
ω(X,≤) je délka nejdelšího řetězce = maximum z délek řetězců (výška uspořádání)
α(X,≤) je délka nejdelšího antiřetězce (šířka uspořádání)
věta: pro každou konečnou ČUM (X,≤) platí α(X,≤)⋅ω(X,≤)≥∣X∣
důsledek: max(α,ω)≥∣X∣
Funkce, typy funkcí (prostá, na, bijekce)
funkce z množiny X do množiny Y je relace A mezi X a Y t. ž. (∀x∈X)(∃!y∈Y):xAy
funkce f:X→Y je…
prostá (injektivní) ≡∄x,x′∈X:x=x′∧f(x)=f(x′)
na Y (surjektivní) ≡(∀y∈Y)(∃x∈X):f(x)=y
vzájemně jednoznačná (bijektivní) ≡(∀y∈Y)(∃!x∈X):f(x)=y
taková funkce je tedy prostá i „na“
k takové funkci existuje inverzní funkce f−1 z Y do X
Počty různých typů funkcí mezi dvěma konečnými množinami
věta: počet f:N→M=mn
pro ∣N∣=n,∣M∣=m;m,n>0
definice: klesající mocnina
mn=nm⋅(m−1)⋅(m−2)⋅…⋅(m−n+1)
tedy mn=(m−n)!m!
věta: počet prostých f:N→M=mn
počet surjektivních zobrazení lze určit pomocí principu inkluze a exkluze
bijekcí je n!
počet uspořádaných k-tic ∣Xk∣=∣X∣k, lze jej totiž vyjádřit jako počet funkcí f:[k]→X
Permutace a jejich základní vlastnosti (počet a pevný bod)
definice: [n]={1,2,…,n}
věta: na množině [n] existuje n! permutací (podobně na každé n-prvkové množině)
pevný bod permutace je prvek, který se zobrazí sám na sebe
Kombinační čísla a vztahy mezi nimi, binomická věta a její aplikace
kombinační číslo (binomický koeficient) (kn):=k!nk=k!(n−k)!n!
Pascalův trojúhelník – n roste shora dolů, k zleva doprava
(kX) … množina všech k-prvkových podmnožin množiny X
(kn)=(n−kn) … každé k-prvkové podmnožině přiřadíme její doplněk
Pascalův trojúhelník je symetrický
(k−1n−1)+(kn−1)=(kn)
zvolíme jeden prvek a a rozdělíme všechny k-prvkové podmnožiny podle toho, zda obsahují a, nebo ne
buňka v Pascalově trojúhelníku je součtem dvou buněk nad ní (pokud není na kraji)
Binomická věta: (x+y)n=∑i=0n(in)xn−iyi
aplikace
řádek Pascalova trojúhelníku se sečte na 2n=(1+1)n=∑k=0n(kn)
Princip inkluze a exkluze: obecná formulace (a důkaz)
konkrétní ukázky principu inkluze a exkluze (PIE)
∣A∪B∣=∣A∣+∣B∣−∣A∩B∣
∣A∪B∪C∣=∣A∣+∣B∣+∣C∣−∣A∩B∣−∣A∩C∣−∣B∩C∣+∣A∩B∩C∣
věta: pro konečné množiny A1,…,An platí ∣i=1⋃nAi∣=k=1∑n(−1)k+1I∈(k[n])∑∣i∈I⋂Ai∣
důkaz
pro prvek x ve sjednocení spočítáme příspěvky k levé (vždy 1) a pravé straně
nechť x patří do právě t množin
průniky k-tic
k>t … přispěje 0
k≤t … přispěje (−1)k+1(kt)
vybíráme k-tice množin z t-množin, do kterých prvek patří
minus jednička vychází ze vzorce
chceme ∑k=1t(−1)k+1(kt)=1
lze upravit na ∑k=1t(−1)k(kt)=−1
z binomické věty 0=(1−1)t=∑k=0t(kt)(−1)k
tedy bez prvního členu se součet rovná −1□
Princip inkluze a exkluze: použití (problém šatnářky, Eulerova funkce pro počet dělitelů, počet surjekcí)
problém šatnářky
Šatnářka n pánům vydá náhodně n klobouků (které si předtím odložili v šatně). Jaká je pravděpodobnost, že žádný pán nedostane od šatnářky zpět svůj klobouk?
jaká je pravděpodobnost, že náhodně zvolená permutace nebude mít žádný pevný bod
každá z n! permutací je stejně pravděpodobná
sˇ(n) … počet permutací bez pevného bodu
pravděpodobnost je rovna sˇ(n)/n!
Sn … množina všech permutací
Ai={π∈Sn∣π(i)=i}
množina permutací s pevným bodem v i-tém prvku (jedna permutace může patřit do více takových množin)
A=⋃i=1nAi … (množina všech „špatných“ permutací)
musíme vyjádřit velikosti průniků
permutací s (konkrétními) k pevnými body je (n−k)!, protože permutuji všechny prvky kromě těch pevných
dosazením do principu inkluze a exkluze vyjde ∣A∣=∑k=1n(−1)k+1(kn)(n−k)!
(kn) vyplývá z počtu prvků druhé sumy
(kn)(n−k)!=k!n!
∣A∣=∑k=1n(−1)k+1k!n!=n!⋅∑k=1nk!(−1)k+1
∣A∣=n!(1!1−2!1+3!1−⋯+n!(−1)n+1)
sˇ(n)=n!−∣A∣=n!⋅(1−1!1+2!1−3!1+⋯+n!(−1)n)
závorka konverguje k e−1
závorka odpovídá pravděpodobnosti v problému šatnářky
sˇ(n)=n!⋅∑k=0nk!(−1)k
pravděpodobnost … ∑k=0nk!(−1)k≈e−1
Eulerova funkce φ(n)
je to počet čísel z [n] nesoudělných s n
pro prvočíslo p platí φ(n)=p−1, protože je soudělné samo se sebou a protože podle definice nesoudělnosti (NSD = 1) není soudělné s jedničkou
tvrzení: nechť n=p1e1⋅p2e2⋅…⋅pkek je prvočíselný rozklad, pak φ(n)=n(1−p11)(1−p21)…(1−pk1)
důkaz
jako Ai označím množinu čísel z [n] soudělných i-tým prvočíslem pi
zjevně φ(n)=n−∣⋃i=1kAi∣
∣Ai∣=pin
pro různé i,j∈[k] platí ∣Ai∩Aj∣=pipjn
to se dá zobecnit na průnik více množin
dle PIE ∣⋃i=1kAi∣=∑I∈2[n]∖{∅}(−1)∣I∣+1∏i∈Ipin
(m−k)n dostaneme tak, že uvažujeme funkce z n-prvkové množiny do množiny s m−k prvky (na vybraných k bodů naše funkce nesmí směřovat)
počet surjekcí mn−∣⋃i=1mFi∣=mn−∑k=1m(−1)k+1(km)(m−k)n pak ještě upravíme do finálního tvaru □
Hallova věta o systému různých reprezentantů a její vztah k párování v bipartitním grafu, princip důkazu a algoritmické aspekty (polynomiální algoritmus pro nalezení SRR)
párování je taková množina hran, kde žádné dvě hrany nemají společný vrchol
maximální párování je takové párování, které má nejvíce hran
perfektní párování je takové párování, které pokrývá všechny vrcholy grafu
systém různých reprezentantů v hypergrafu
systém různých reprezentantů (SRR) v hypergrafu H=(V,E) je funkce r:E→V taková, že
∀e∈E:r(e)∈e
∀e,f∈E:e=f⟹r(e)=r(f) … tj. r je prostá
r(e) … „reprezentant hyperhrany e“
analogie s předsedy spolků
pozorování: v bipartitním grafu s partitami A,B má každé párování velikost nejvýše ∣A∣ (i nejvýše ∣B∣)
definice: pro graf G=(V,E) a množinu X⊆V označím N(X):={y∈V∖X:(∃x∈X){x,y}∈E}
Hallova věta, bipartitní grafová verze
nechť G je bipartitní graf s partitami A,B, potom G má párování velikosti ∣A∣⟺„Hallova podmıˊnka“∀X⊆A:∣N(X)∣≥∣X∣
důkaz
⟹
pokud existuje párování velikosti ∣A∣, tak pro každou X⊆A existuje ∣X∣ vrcholů spárovaných s X, ty patří do N(X), tedy ∣N(X)∣≥∣X∣
⟸
nechť M je největší párování v G
pro spor nechť ∣M∣<∣A∣
dle Kőnigovy–Egerváryho věty existuje pokrytí C, kde ∣C∣=∣M∣<∣A∣
CA:=C∩A
CB:=C∩B
X:=A∖CA
zjistím, že N(X)⊆CB
protože nepokryté hrany musí pokrývat vrcholy v N(X)
navíc ∣X∣=∣A∣−∣CA∣>∣CB∣≥∣N(X)∣
jelikož ∣C∣<∣A∣⟹∣A∣>∣CA∣+∣CB∣
to je spor s Hallovou podmínkou
idea ⟸
uvažujeme ostře menší párování, tedy podle Kőnigovy–Egerváryho věty musí existovat i menší pokrytí
věta říká, že velikost maximální párování se rovná velikosti minimálního pokrytí (jako u toku a řezu)
prohlásíme, že vrcholy v X nejsou v pokrytí, tak ty hrany mezi nimi a N(X) musí pokrývat vrcholy v N(X), ale těch by pak bylo málo (méně než požaduje Hallova podmínka)
takže jsme dokázali obměnu implikace
pozorování: jakmile uvnitř hypergrafu je množina čtyř hyperhran, které ve svém sjednocení mají tři vrcholy, tak nemůžu najít systém různých reprezentantů
platí to obecně pro množinu k hyperhran – když budou mít ve sjednocení méně než k vrcholů, tak nenajdu SRR
implikace platí i obráceně, lze vyslovit jako větu
Hallova věta, hypergrafová verze
hypergraf H=(V,E) má SRR, právě když ∀F⊆E:⋃e∈Fe≥∣F∣
důkaz
nechť H=(V,E) je hypergraf, nechť IH je jeho graf incidence
H má SRR ⟺IH má párování velikosti ∣E∣
Hallova podmínka pro H: ∀F⊆E:⋃e∈Fe≥∣F∣⟺ bipartitní Hallova podmínka pro IH a partitu E
algoritmické aspekty
maximální párování lze najít v polynomiálním čase
proto i SRR lze najít v polynomiálním čase
4. Teorie grafů
Základní pojmy teorie grafů – graf, vrcholy a hrany, izomorfismus grafů, podgraf, okolí vrcholu a stupeň vrcholu, doplněk grafu, bipartitní graf
graf je (V,E), kde V je konečná neprázdná množina vrcholů a E⊆(2V) je množina hran
lze značit jako G=(V,E), potom V(G) je množina vrcholů a E(G) je množina hran
izomorfismus
grafy jsou izomorfní ≡ existuje bijekce, která zachovává vlastnost být spojen hranou
v podstatě stačí přejmenovat vrcholy a dostaneme dva stejné grafy
značení ≅
≅ je ekvivalence na libovolné množině grafů
neexistuje množina všech grafů (protože neexistuje množina všech množin)
podgraf
graf G′=(V′,E′) je podgrafem grafu G=(V,E) (značíme G′⊆G), když V′⊆V∧E′⊆E
graf G′=(V′,E′) je indukovaným podgrafem grafu G=(V,E), když V′⊆V∧E′=E∩(2V′)
„podgraf indukovaný množinou vrcholů“
G[A]:=(A,E(G)∩(2A)), kde A⊆V(G)
okolí vrcholu
okolí vrcholu v jsou ty vrcholy, které s vrcholem v sousedí (sdílejí hranu)
NG(v)={u∈V(G):∃uv∈E(G)}
stupeň vrcholu
stupeň vrcholu – počet hran, kterých se účastní daný vrchol
graf je k-regulární, pokud je stupeň všech vrcholů grafu roven k
skóre grafu = posloupnost stupňů vrcholů (až na pořadí) → jakmile dvěma grafům vyjde jiné skóre, nemohou být izomorfní
doplněk grafu
doplněk/komplement grafu G je graf G0, který má stejné vrcholy jako G, ale má právě ty hrany, které v grafu G chybí
bipartitní graf
graf (V, E) je bipartitní ≡∃L,P⊆V t. ž.:
L∪P=V
L∩P=∅
∀e∈E:∣e∩L∣=1(∧∣e∩P∣=1)
nebo E(G)⊆{{x,y}∣x∈L,y∈P}
partity grafu – jednotlivé „strany“
Základní příklady grafů – úplný graf a úplný bipartitní graf, cesty a kružnice
úplný graf Kn
V(Kn):=[n]
E(Kn):=(2V(Kn))
úplný bipartitní Km,n
každý prvek nalevo je spojený s každým napravo
prvky na jedné straně mezi sebou nejsou spojeny
prázdný graf En
V(En):=[n]
E(En)=∅
cesta Pn
V(Pn):={0,…,n}
E(Pn):={{i,i+1}∣0≤i<n}
délka cesty se měří v počtu hran
kružnice/cyklus Cn
n≥3
V(Cn):={0,…,n–1}
E(Cn):={{i,(i+1)modn}∣0≤i<n}
Souvislost grafů, komponenty souvislosti, vzdálenost v grafu
graf G je souvislý ≡∀u,v∈V(G): existuje cesta v G s krajními vrcholy u,v
dosažitelnost v G je relace ∼ na V(G) t. ž. u∼v≡ existuje cesta v G s krajními vrcholy u,v
relace ∼ je ekvivalence
tranzitivita se dokazuje pomocí dvou posloupností vrcholů x∼y a y∼z a následně zvolení nejzazšího vrcholu z posloupnosti y∼z, který je obsažen v posloupnosti x∼y a v tomto vrcholu se posloupnosti slepí (přičemž části za ním v první posloupnosti a před ním v druhé posloupnosti se ustřihnou)
komponenty souvislosti jsou podgrafy indukované třídami ekvivalence ∼
komponenty jsou souvislé
graf je souvislý ⟺ má 1 komponentu
vzdálenost (grafová metrika) v souvislém grafu G
dG:V2→R
dG(u,v):= min. z délek (počtu hran) všech cest mezi u,v
vlastnosti metriky (funkce je metrika = chová se jako vzdálenost)
dG(u,v)≥0
dG(u,v)=0⟺u=v
platí trojúhelníková nerovnost dG(u,w)≤dG(u,w)+dG(w,v)
dG(v,u)=dG(u,v)
grafové operace: přidání/odebrání vrcholu/hrany, dělení hrany, kontrakce hrany
sled v grafu (walk) – můžou se opakovat vrcholy i hrany
(v0,e1,v1,e2,…,en,vn)
∀i:ei={vi−1,vi}
tah v grafu – můžou se opakovat vrcholy, hrany ne
tah může být uzavřený (končí, kde začal), nebo otevřený
eulerovský tah
eulerovský tah obsahuje všechny hrany a vrcholy grafu
někdy se eulerovský tah definuje bez nutnosti obsahovat všechny vrcholy
graf je eulerovský ≡ existuje v něm uzavřený eulerovský tah
věta: graf G je eulerovský ⟺G je souvislý a každý jeho vrchol má sudý stupeň
Stromy – definice a základní vlastnosti (existence listů, počet hran stromu)
strom je souvislý graf bez kružnic (= acyklický)
les je acyklický graf
list je vrchol stupně 1
strom o jednom vrcholu („pařez“) nemá žádný list
lemma: každý strom s aspoň 2 vrcholy má aspoň 1 list (respektive aspoň dva listy)
lemma: je-li v list grafu G, pak G je strom, právě když G−v je strom
strom G má ∣V(G)∣−1 hran (Eulerova formule)
Ekvivalentní charakteristiky stromů
G je souvislý a acyklický (strom)
mezi vrcholy u,v existuje právě jedna cesta (jednoznačně souvislý)
G je souvislý a po smazání libovolné jedné hrany už nebude souvislý (minimální souvislý)
G je acyklický a po přidání libovolné jedné hrany vznikne cyklus (maximální acyklický)
G je souvislý a platí pro něj Eulerova formule ∣E(G)∣=∣V(G)∣−1
Rovinné grafy – definice a základní pojmy (rovinný graf a rovinné nakreslení grafu, stěny)
rovinné nakreslení grafu = nakreslení grafu, aby se hrany nekřížily
vrcholy = body v rovině (navzájem různé)
hrany = křivky, které se neprotínají a jejich společnými body jsou jejich společné vrcholy
stěny nakreslení
části, na které nakreslení grafu rozděluje rovinu
stěnou je i vnější stěna (zbytek roviny)
hranice stěny – skládá se z hran
hranice stěny je nakreslení uzavřeného sledu
graf je rovinný, pokud má alespoň jedno rovinné nakreslení
topologický graf je uspořádaná dvojice (graf, nakreslení)
K5 a K3,3 nejsou rovinné
graf je rovinný, právě když žádný jeho podgraf není izomorfní s nějakým dělením grafu K5 nebo K3,3 (tzn. podgraf může mít podrozdělené hrany – „K5“ s libovolně podrozdělenými hranami pořád nebude rovinná)
Eulerova formule a maximální počet hran rovinného grafu (důkaz a použití)
věta
nechť G je souvislý graf nakreslený do roviny, v:=∣V(G)∣,e:=∣E(G)∣,f:= počet stěn nakreslení
potom v+f=e+2 (Eulerova formule)
důkaz: indukcí podle e
e=v−1 (G je strom)
f=1
v+1=v−1+2✓
e−1→e
mějme graf G s e hranami
zvolím si libovolnou hranu x na kružnici
G′:=G−x
v′=v,e′=e−1,f′=f−1
z IP: v′+f′=e′+2
po dosazení: v+f−1=e−1+2
k oběma stranám přičteme jedničku
v+f=e+2□
věta: maximální rovinný graf je triangulace
dokud hranice stěny není trojúhelník, je tam nějaká dvojice nespojených vrcholů
počet hran maximálního rovinného grafu
každá stěna přispěje třemi hranami
každá hrana patří ke dvěma stěnám
počítáme „strany hran“: 3f=2e
f=32e
v+32e=e+2
e=3v−6
věta: v každém rovinném grafu s aspoň 3 vrcholy je ∣E∣≤3∣V∣−6
důkaz
doplníme do G hrany, až získáme maximální rovinný G′
e′=3v−6 (vrcholy nepřidáváme)
e≤e′=3v−6
důsledek
průměrný stupeň vrcholu v rovinném grafu je menší než 6
∑deg(ξ)=2e≤6v−12
průměrný stupeň ≤v6v−12<6
počet hran a vrchol nízkého stupně v rovinných grafech bez trojúhelníků
maximální rovinné grafy bez trojúhelníků mají stěny čtvercové, pětiúhelníkové, nebo to může být strom ve tvaru hvězdy
pro čtvercově stěny platí 4f=2e, pro pětiúhelníkové 5f=2e
obecně 4f≤2e→f≤21e
v+21e≥e+2
e≤2v−4
průměrný stupeň ≤v4v−8< 4
existuje vrchol stupně max. 3
Barevnost grafů – definice dobrého obarvení, vztah barevnosti a klikovosti grafu
obarvení grafu Gk barvami (k-obarvení) je c:V(G)→[k] t. ž. kdykoli {x,y}∈E(G), pak c(x)=c(y)
barevnost χ(G) grafu G:=min k:∃ k-obarvení grafu G
pozorování: kdykoli H⊆G, pak χ(H)≤χ(G)
barevnost některých grafů
úplné grafy … χ(Kn)=n
cesty … χ(Pn)=2 pro n≥1
sudé kružnice … χ(C2k)=2
liché kružnice … χ(C2k+1)=3
stromy jsou 2-obarvitelné
pro rovinné grafy existuje věta o čtyřech barvách (je to těsný horní odhad – existují rovinné grafy, které nelze obarvit třemi barvami, např. K4)
věta: χ(G)≤2⟺G je bipartitní ⟺G neobsahuje lichou kružnici
definice: klikovost grafu κ(G) je maximální k takové, že v grafu jako podgraf existuje úplný graf Kk
χ(G)≥κ(G)
klika v grafu je množina vrcholů taková, že každé dva jsou spojené hranou
nezávislá množina v grafu je množina vrcholů taková, že žádné dva vrcholy nejsou spojené hranou
Hranová a vrcholová souvislost grafů
F⊆E je hranový řez v G, pokud G−F je nesouvislý
kde G−F:=(V,E∖F)
graf je hranově k-souvislý, pokud neobsahuje žádný hranový řez velikosti menší než k
stupeň hranové souvislosti (nebo jen hranová souvislost) grafu G, značený ke(G), je největší k takové, že G je hranově k-souvislý
pozorování: ke(G)= velikost nejmenšího hranového řezu v G
A⊆V je vrcholový řez, pokud G−A je nesouvislý
kde G−A=(V∖A,E∩(2V∖A))
graf je vrcholově k-souvislý, pokud má aspoň k+1 vrcholů a neobsahuje žádný vrcholový řez velikosti menší než k
vrcholová souvislost grafu G, značená kv(G), je největší k takové, že G je vrcholově k-souvislý
pozorování: kv(Kn)=n−1
pozorování: G není úplný … kv(G)= velikost nejmenšího vrcholového řezu
Hranová a vrcholová verze Mengerovy věty
Mengerova věta, hranová xy-verze
pro dva různé vrcholy x,y grafu G platí, že G obsahuje k hranově disjunktních cest z x do y⟺G neobsahuje hranový xy-řez velikosti menší než k
Mengerova věta, globální hranová verze
graf G je hranově k-souvislý ⟺ mezi každými dvěma různými vrcholy existuje k hranově disjunktních cest
definice: dvě cesty v G z x do y jsou navzájem vnitřně vrcholově disjunktní (VVD), pokud nemají žádný společný vrchol kromě x,y
Mengerova věta, vrcholová xy-verze
nechť G=(V,E) je graf
nechť x,y jsou různé nesousední vrcholy
nechť k∈N
potom G obsahuje k navzájem VVD cest z x do y⟺G neobsahuje vrcholový xy-řez velikosti <k
Mengerova věta, globální vrcholová verze
G je vrcholově k-souvislý ⟺ mezi každými dvěma různými vrcholy x,y existuje k navzájem VVD cest
Orientované grafy, silná a slabá souvislost
orientovaný graf … (V,E):E⊆V2∖{(x,x)∣x∈V}
nepovolíme smyčky (v podstatě zakážeme diagonálu na relaci)
podkladový graf je neorientovaný graf založený na tom původním orientovaném
pro orientovaný G=(V,E) existuje podkladový G0=(V,E0), kde {u,v}∈E0≡(u,v)∈E∨(v,u)∈E
vstupní a výstupní stupeň degin,degout (hrany vedoucí do vrcholu / z vrcholu)
vrchol je vyvážený ≡degin(v)=degout(v)
graf je vyvážený ≡ všechny vrcholy jsou vyvážené
součet vstupních stupňů = součet výstupních stupňů = počet hran
orientovaný graf je slabě souvislý ≡ jeho podkladový graf je souvislý
o. graf je silně souvislý ≡ existuje orientovaná cesta mezi každými dvěma vrcholy
silná souvislost ⟹ slabá souvislost
věta: pro orientovaný graf G platí: G je vyvážený a slabě souvislý ⟺G je eulerovský ⟺G je vyvážený a silně souvislý
Toky v sítích: definice sítě a toku v ní
tokovou síť tvoří
V … množina vrcholů
E … množina orientovaných hran, E⊆V×V
z∈V … zdroj
s∈V∖{z} … spotřebič / stok
c:E→[0,+∞) … c(e) je kapacita hrany e
definice umožňuje mít hrany oběma směry, připouští také smyčky, ty však z hlediska toků v sítích nejsou nijak užitečné
poznámka: ze stoku může vycházet orientovaná hrana, podobně do zdroje může vést hrana
tok v síti (V,E,z,s,c) je funkce f:E→[0,+∞) splňující
∀e∈E:0≤f(e)≤c(e)
∀x∈V∖{z,s}: součet toků do vrcholu x se rovná součtu toků z vrcholu (formálně pomocí sum) … Kirchhoffův zákon
Existence maximálního toku (bez důkazu)
velikost toku f v síti (V,E,z,s,c) je w(f):=f[Out(z)]−f[In(z)]
kde Out(z) a In(z) jsou množiny hran do, respektive ze zdroje a f[A]:=∑e∈Af(e) pro A⊆E
maximální tok je tok, který má největší velikost
fakt: v každé tokové síti existuje maximální tok
poznámka: obecně na přednášce uvažujeme konečné tokové sítě, grafy apod.
idea důkazu
mějme síť, očíslujme hrany (od 1 do m)
tok f reprezentujme jako uspořádanou m-tici hodnot
množina všech toků je uzavřená a omezená podmnožina Rm, je tedy kompaktní
funkce, která toku f přiřadí w(f), je spojitá
víme z analýzy, že spojitá funkce na kompaktní množině nabývá maxima
řez v síti (V,E,z,s,c) je množina hran R⊆E taková, že každá orientovaná cesta ze z do s obsahuje aspoň jednu hranu R
Minimaxová věta o toku a řezu: nechť fmax je maximální tok a Rmin je minimální řez v (V,E,z,s,c), potom w(fmax)=c(Rmin)
Princip hledání maximálního toku v síti s celočíselnými kapacitami (například pomocí Ford-Fulkersonova algoritmu)
rezerva hrany uv
r(uv):=c(uv)−f(uv)+f(vu)
hrana je nasycená ≡ má nulovou rezervu
hrana je nenasycená ≡ má kladnou rezervu
cesta je nenasycená ≡ žádná její hrana není nasycená / všechny mají kladné rezervy
algoritmus
iterujeme, dokud existuje nenasycená cesta ze zdroje do stoku
spočítáme rezervu celé cesty (minimum přes rezervy hran cesty)
pro každou hranu upravíme tok – v protisměru odečteme co nejvíc, zbytek přičteme po směru
geometrický – např. „náhodně“ střílíme na terč, takže šance, že zasáhneme konkrétní oblast, je úměrná obsahu oblasti (ale může být i ve více než dvou dimenzích)
spojitý – schopný střelec se trefuje spíše do středu terče (opět dovolíme i jiné než uniformní rozdělení)
chyba 2. druhu – chybné přijetí, „promarněná příležitost“
hladina významnosti α … pravděpodobnost chyby 1. druhu
typicky se volí α=0.05
β … pravděpodobnost chyby 2. druhu
kritický obor … je to množina, kterou určíme před provedením testu; pokud se výsledek našeho testu bude nacházet v kritickém oboru, zamítneme nulovou hypotézu
tedy α=P(h(X)∈W;H0)
síla testu … 1−β
chceme co největší
p-hodnota … nejmenší α taková, že na hladině α zamítáme H0
6. Logika
Znalost a práce se základními pojmy syntaxe výrokové a predikátové logiky (jazyk, otevřená a uzavřená formule, instance formule, apod.)
výroková logika
jazyk je určený neprázdnou množinou výrokových proměnných P (také jim říkáme prvovýroky nebo atomické výroky)
množina P může být konečná nebo i nekonečná (ale obvykle bude spočetná) a bude mít dané uspořádání
predikátová logika
signatura je dvojice ⟨R,F⟩, kde R,F jsou disjunktní množiny symbolů (relační a funkční, ty zahrnují konstantní) spolu s danými aritami a neobsahují symbol =
do jazyka patří…
spočetně mnoho proměnných
relační, funkční a konstantní symboly ze signatury a symbol =, jde-li o jazyk s rovností
univerzální a existenční kvantifikátory pro každou proměnnou
symboly pro logické spojky a závorky
struktura v signatuře ⟨R,F⟩ je trojice A=⟨A,RA,FA⟩, kde…
A je neprázdná množina, říkáme jí doména (také universum)
RA je množina interpretací jednotlivých relačních symbolů (kde interpretace n-árního relačního symbolu je množina uspořádaných n-tic prvků z A)
FA je množina interpretací jednotlivých funkčních symbolů (kde intepretace n-árního funkčního symbolu odpovídá funkci přiřazující n-tici prvků z A jeden prvek z A)
speciálně pro konstantní symbol c∈F je cA∈A
termy jazyka L jsou konečné nápisy definované induktivně
proměnná je term
konstantní symbol je term
pro n-ární funkční symbol f a termy t1,…,tn je nápis f(t1,…,tn) také term
atomická formule jazyka L je nápis R(t1,…,tn), kde R je n-ární relační symbol z L (v jazyce s rovností to může být i rovnost) a ti je L-term
formule jazyka L jsou konečné nápisy definované induktivně
atomická formule je formule
negace formule je formule
spojením dvou formulí binární logickou spojkou dostaneme formuli
přidáním kvantifikátoru před formuli dostaneme formuli
výskyt proměnné je vázaný, pokud jí odpovídá nějaký kvantifikátor, jinak je výskyt volný
proměnná je volná, pokud má volný výskyt, je vázaná, pokud má vázaný výskyt
formule je otevřená, neobsahuje-li žádný kvantifikátor
formule je uzavřená (= sentence), pokud nemá žádnou volnou proměnnou
term t je substituovatelný za proměnnou x ve formuli φ, pokud po simultánním nahrazení všech volných výskytů x ve φ za t nevznikne ve φ žádný vázaný výskyt proměnné z t
v tom případě říkáme vzniklé formuli instance φ vzniklá substitucí t za x a označujeme ji φ(x/t)
Prenexní tvary formulí predikátové logiky
PNF = kvantifikátory jsou před formulí, formule se dělí na kvantifikátorový prefix a otevřené jádro
převod na PNF – postupně kvantifikátory vytahuju (podle pravidel), v případě potřeby přejmenuju proměnnou, tím vznikne varianta (pokud je v druhé části formule volná proměnná se stejným názvem)
pravidlo převodu: pokud vytahujeme kvantifikátor z negace, musíme ho „přepnout“ (pozor: u implikace je levá strana jakoby negovaná)
Znalost základních normálních tvarů (CNF, DNF, PNF)
PNF = kvantifikátory jsou před formulí, formule se dělí na kvantifikátorový prefix a otevřené jádro
tvary výroků
literál je prvovýrok nebo negace prvovýroku
pro literál ℓ označuje ℓ literál k němu opačný (tedy jeho negaci)
klauzule je disjunkce literálů
jednotková klauzule je samotný literál
prázdná klauzule je ⊥
výrok je v konjunktivní normální formě (CNF), pokud je konjunkcí klauzulí
prázdný výrok v CNF je ⊤
elementární konjunkce je konjunkce literálů
jednotková elementární konjunkce je samotný literál
prázdná elementární konjunkce je ⊤
výrok je v disjunktivní normální formě (DNF), pokud je disjunkcí elementárních konjunkcí
prázdný výrok v DNF je ⊥
výrok je hornovský (v Hornově tvaru), pokud je konjunkcí hornovských klauzulí, tj. klauzulí obsahujících nejvýše jeden pozitivní literál
množinová reprezentace
klauzule je konečná množina literálů
prázdnou klauzuli označíme □, není nikdy splněna
CNF formule je (konečná nebo nekonečná) množina klauzulí
prázdná formule ∅ je vždy splněna
Převody na normální tvary
sémantický převod
najdeme modely výroku
pro DNF budeme uvažovat disjunkci elementárních konjunkcí, přičemž každá elementární konjunkce popíše jeden model
pro CNF musíme najít nemodely formule, každá klauzule zakáže jeden nemodel
pokud je první nemodel (0,0,0), pak první klauzule bude (p∨q∨r)
syntaktický převod
přepíšeme implikaci a ekvivalenci pomocí konjunkce, disjunkce a negace
přesuneme negace dovnitř (k literálům)
použijeme distributivitu konjunkce a disjunkce, abychom jednu přesunuli dovnitř (podle toho, jestli chceme CNF nebo DNF)
Použití normálních tvarů pro algoritmy (SAT, rezoluce)
problém Horn-SAT
výrok je hornovský, pokud je konjunkcí hornovských klauzulí, tj. klauzulí obsahujících nejvýše jeden pozitivní literál
algoritmus
pokud φ obsahuje dvojici opačných jednotkových klauzulí, není splnitelný
pokud φ neobsahuje žádnou jednotkovou klauzuli, je splnitelný, ohodnotíme všechny zbývající proměnné nulou
pokud φ obsahuje jednotkovou klauzuli ℓ, ohodnotíme literál ℓ hodnotou 1, provedeme jednotkovou propagaci a postup opakujeme
jednotková propagace pro ℓ=1
každou klauzuli obsahující ℓ odstraníme (protože je takto splněna)
ℓ odstraníme ze všech klauzulí, které ho obsahují (protože ℓ nemůže zajistit splnění dané klauzule)
Horn-SAT lze řešit v lineárním čase
algoritmus DPLL pro řešení SAT
literál ℓ má čistý výskyt ve φ, pokud se ℓ vyskytuje ve φ a opačný literál ℓ se ve φ nevyskytuje
takový literál můžu nastavit na 1
to neovlivní splnitelnost výroku, ale zmenší to množinu modelů, které jsem schopen nalézt
algoritmus
dokud φ obsahuje jednotkovou klauzuli ℓ, ohodnoť ℓ=1 a proveď jednotkovou propagaci
dokud existuje literál ℓ, který má ve φ čistý výskyt, ohodnoť ℓ=1 a odstraň klauzule obsahující ℓ
pokud φ neobsahuje žádnou klauzuli, je splnitelný
pokud φ obsahuje prázdnou klauzuli, není splnitelný
jinak zvol dosud neohodnocenou výrokovou proměnnou p a zavolej algoritmus rekurzivně na φ∧p a na φ∧¬p
algoritmus běží v exponenciálním čase
rezoluce
použitím rezolučního pravidla z klauzulí φ∨p a ψ∨¬p dostaneme φ∨ψ
takhle spolu můžeme postupně rezolvovat různé klauzule z teorie
pokud nám vyjde prázdná klauzule, je teorie sporná
k dokázání výroku φ v teorii T hledáme rezoluční zamítnutí T∪¬φ
nebo přímo rezoluční důkaz výroku φ (tzn. na konci rezoluce nám vyjde φ)
Pojem modelu teorie
model (jazyka) ve výrokové logice je pravdivostní ohodnocení proměnných
model v je modelem teorie T, pokud každý axiom z T v modelu v platí, píšeme v⊨T
v predikátové logice: model jazyka L nebo také L-struktura je libovolná struktura v signatuře jazyka L
model teorie T je L-struktura, ve které platí všechny axiomy teorie T
Pravdivost, lživost, nezávislost formule vzhledem k teorii, splnitelnost, tautologie, důsledek
pravdivý výrok platí v každém modelu (jazyka/teorie)
je pravdivý v logice = platí v logice = je tautologie
je pravdivý v T = platí v T = je důsledek T
lživý (sporný) výrok neplatí v žádném modelu
nezávislý výrok platí v nějakém modelu a neplatí v jiném modelu
splnitelný výrok platí v nějakém modelu (tedy není lživý, je pravdivý nebo nezávislý)
Analýza výrokových teorií nad konečně mnoha prvovýroky
nechť T je bezesporná teorie nad P
∣P∣=n∈N+ … počet proměnných v jazyce
m=∣MP(T)∣ … velikost množiny modelů teorie T
neekvivalentních výroků nad P je 22n
každý výrok odpovídá jedné podmnožině množiny modelů (všech modelů je 2n)
neekvivalentních výroků nad P pravdivých/lživých v T je 22n−m
neekv. výroků nad P nezávislých v T je 22n−2⋅22n−m
vezmeme všechny a odečteme pravdivé a lživé
neekv. jednoduchých extenzí teorie T je 2m, z toho sporná je jedna
podle toho, které modely ubereme
neekv. kompletních jednoduchých extenzí teorie T je m
každá odpovídá jednomu modelu
T-neekvivalentních výroků nad P je 2m
T-neekv. výroků nad P pravdivých/lživých (v T) je 1
T-neekv. výroků nad P nezávislých (v T) je 2m−2
Extenze teorií – schopnost porovnat sílu teorií, konzervativnost, skolemizace
extenze teorie T je libovolná teorie T′ v jazyce P′⊇P splňující CsqP(T)⊆CsqP′(T′)
kde CsqP(T) je množina všech důsledků teorie (výroků/sentencí pravdivých v teorii T v jazyce P)
extenze je jednoduchá, pokud P′=P
extenze je konzervativní, pokud CsqP(T)=CsqP(T′)=CsqP′(T′)∩VFP
sémantický význam (v řeči modelů)
mějme teorii T v jazyce P a teorii T′ v jazyce P′, kde P⊆P′
T′ je jednoduchou extenzí T, právě když P′=P a MP(T′)⊆MP(T)
T′ je extenzí T, právě když MP′(T′)⊆MP′(T)
T′ je konzervativní extenzí T, pokud je extenzí a navíc platí, že každý model T lze nějak expandovat na model T′
T′ je extenzí T a zároveň T je extenzí T′, právě když T′∼T (jazyky a množiny modelů se rovnají)
kompletní jednoduché extenze T jednoznačně až na ekvivalenci odpovídají modelům T
T′ je extenzí T o definice, pokud vznikla z T postupnou extenzí o definice relačních a funkčních (případně konstantních) symbolů
je-li T′ extenze teorie T o definice, potom platí:
každý model teorie T lze jednoznačně expandovat na model T′
T′ je konzervativní extenze T
pro každou L′-formuli φ′ existuje L-formule φ taková, že T′⊨φ′↔φ
Skolemova varianta sentence vzniká z původní PNF sentence skolemizací
skolemizace spočívá v tom, že tyto kroky iterujeme přes všechny existenční kvantifikátory (∃yi)
odstraníme z prefixu existenční kvantifikátor (∃yi)
za proměnnou yi substituujeme term fi(x1,…,xni), kde x1,…,xni jsou proměnné, jejichž univerzální kvantifikátory předcházejí (∃yi)
začínáme s L-sentencí v PNF, jejíž všechny vázané proměnné jsou různé
dostaneme L′-sentenci v PNF, kde L′ je rozšíření L o nové ni-ární funkční symboly
Dokazatelnost – pojem formálního důkazu, zamítnutí; schopnost práce v některém z formálních dokazovacích systémů (např. tablo)
důkaz, zamítnutí
důkaz faktu, že v teorii T platí výrok φ je konečný syntaktický objekt vycházející z axiomů T a výroku φ
důkaz konstruujeme syntakticky, aniž bychom se museli zabývat modely
po dokazovacím systému požadujeme dvě vlastnosti: korektnost (je-li výrok dokazatelný z T, je pravdivý v T) a úplnost (je-li výrok pravdivý v T, je dokazatelný z T)
důkaz říká, že φ platí, zamítnutí říká, že φ neplatí
rezoluční důkaz φ v teorii S má v kořeni φ, rezoluční zamítnutí teorie S má v kořeni □
tablo důkaz
konečné tablo z teorie T je uspořádaný, položkami označkovaný strom zkonstruovaný aplikací konečně mnoha následujících pravidel:
jednoprvkový strom označkovaný libovolnou položkou je tablo z teorie T
pro libovolnou položku P na libovolné větvi V můžeme na konec větve V připojit atomické tablo pro položku P
na konec libovolné větve můžeme připojit položku Tα pro libovolný axiom teorie α∈T
tablo je konečné nebo nekonečné, každopádně vzniklo ve spočetně mnoha krocích
tablo pro položku P je tablo s položkou P v kořeni
tablo důkaz výroku φ z teorie T je sporné tablo z teorie T s položkou Fφ v kořeni
pokud existuje, je φ tablo dokazatelný z T, píšeme T⊢φ
podobně definujeme tablo zamítnutí s Tφ v kořeni, tablo zamítnutelnost se značí T⊢¬φ
tablo je sporné, pokud je každá jeho větev sporná
větev je sporná, pokud obsahuje položky Tψ a Fψ pro nějaký výrok ψ, jinak je bezesporná
tablo je dokončené, pokud je každá jeho větev dokončená
větev je dokončená…
pokud je sporná
nebo pokud je každá její položka na této větvi redukovaná a pokud větev zároveň obsahuje položku s T pro každý axiom teorie
položka je redukovaná na dané větvi, pokud obsahuje pouze výrokovou proměnnou nebo se na dané větvi vyskytuje jako kořen atomického tabla (tedy došlo k jejímu rozvoji na dané větvi)
v predikátové logice navíc řešíme kvantifikátory – položky typu svědek a všichni
Věty o kompaktnosti a úplnosti výrokové a predikátové logiky – znění a porozumění významu; použití na příkladech, důsledky
věta o kompaktnosti: teorie má model, právě když každá její konečná část má model
aplikace
popíšeme požadovanou vlastnost nekonečného objektu pomocí (nekonečné) výrokové teorie
z konečné části teorie sestrojíme konečný podobjekt mající danou vlastnost
příklady
spočetně nekonečný graf je bipartitní ⟺ každý jeho konečný podgraf je bipartitní
T={pu→¬pv∣{u,v}∈E(G)}
nestandardní model přirozených čísel
vezmeme standardní model přirozených čísel (jeho teorii)
přidáme nový konstantní symbol
přidáme k teorii výrok, že je ta konstanta ostře větší než každý n-tý numerál
každá konečná část této nové teorie má model, takže i celá ta nová teorie má
První věta o neúplnosti: Pro každou bezespornou rekurzivně axiomatizovanou extenzi T Robinsonovy aritmetiky existuje sentence, která je pravdivá v N, ale není dokazatelná v T.
Robinsonova aritmetika je teorie jazyka aritmetiky L=⟨S,+,⋅,0,≤⟩ s rovností
má osm (tradičně spíše sedm) axiomů, některé z nich:
S(x)=0
S(x)=S(y)→x=y
x+0=x
x+S(y)=S(x+y)
N=⟨N,S,+,⋅,0,≤⟩ … standardní model přirozených čísel
důsledek 1.1: je-li T rekurzivně axiomatizovaná extenze Robinsonovy aritmetiky a je-li navíc N modelem teorie T, potom T není kompletní
pro sentenci, která není dokazatelná v T, nemůže být dokazatelná ani její negace (byl by to spor s její pravdivostí v N)
důsledek 1.2: teorie Th(N) není rekurzivně axiomatizovatelná
kdyby byla, nemohla by být kompletní – ale ona kompletní je
značení: Th(N) … množina všech sentencí pravdivých v N (tzv. teorie struktury N)
věta (Rosserův trik): v každé bezesporné rekurzivně axiomatizované extenzi Robinsonovy aritmetiky existuje nezávislá sentence – tedy taková není kompletní
v podstatě plyne z důsledku 1.1, jen se zbavuje N
Druhá věta o neúplnosti: Pro každou bezespornou rekurzivně axiomatizovanou extenzi T Peanovy aritmetiky platí, že ConT není dokazatelná v T.
ConT … sentence vyjadřující bezespornost (konzistence) teorie T
ConT=¬(∃y)PrfT(0=S(0),y)
PrfT(x,y) … y je důkaz x v T
důsledek 2.1: existuje model Peanovy aritmetiky (PA), ve kterém platí sentence (∃y)PrfPA(0=S(0),y)
důsledek 2.2: existuje bezesporná rekurzivně axiomatizovaná extenze T Peanovy aritmetiky, která dokazuje svou spornost, tj. taková, že T⊢¬ConT
důsledek 2.3: je-li teorie množin ZFC bezesporná, nemůže být sentence ConZFC v teorii ZFC dokazatelná
Rozhodnutelnost – pojem kompletnosti a její kritéria, význam pro rozhodnutelnost; příklady rozhodnutelných a nerozhodnutelných teorií
teorie je sporná, jestliže… (ekvivalentně)
v ní platí spor
nemá žádný model
v ní platí všechny výroky
teorie je bezesporná (splnitelná), pokud není sporná, tj. má nějaký model
teorie je kompletní jestliže není sporná a každý výrok (respektive sentence) je v ní pravdivý nebo lživý (tj. nemá žádné nezávislé výroky), ekvivalentně, pokud má právě jeden model (až na elementární ekvivalenci v predikátové logice)
struktury A,B (v témž jazyce) jsou elementárně ekvivalentní, pokud v nich platí tytéž sentence (značíme A≡B)
zjevně A≡B⟺Th(A)=Th(B)
o teorii T říkáme, že je…
rozhodnutelná, pokud existuje algoritmus, který pro každou vstupní formuli φ doběhne a odpoví, zda T⊨φ
částečně rozhodnutelná, pokud existuje algoritmus, který pro každou vstupní formuli φ…
pokud T⊨φ, doběhne a odpoví „ano“
pokud T⊭φ, buď nedoběhne, nebo doběhne a odpoví „ne“
„rekurzivní“ pojmy
teorie T je rekurzivně axiomatizovaná, pokud existuje algoritmus, který pro každou vstupní formuli φ doběhne a odpoví, zda φ∈T
třída L-struktur K⊆ML je rekurzivně axiomatizovatelná, pokud existuje rekurzivně axiomatizovaná L-teorie T taková, že K=ML(T)
teorie T′ je rekurzivně axiomatizovatelná, pokud je rekurzivně axiomatizovatelná třída jejích modelů, neboli pokud je T′ ekvivalentní nějaké rekurzivně axiomatizované teorii
řekneme, že teorie T má rekurzivně spočetnou kompletaci, pokud (nějaká) množina (až na ekvivalenci) všech jednoduchých kompletních extenzí teorie T je rekurzivně spočetná, tj. existuje algoritmus, který pro danou vstupní dvojici přirozených čísel (i,j) vypíše na výstup i-tý axiom j-té extenze (v nějakém pevně daném uspořádání), nebo odpoví, že takový axiom už neexistuje
tvrzení: je-li T rekurzivně axiomatizovaná, potom je částečně rozhodnutelná, je-li navíc kompletní, je rozhodnutelná
tvrzení: je-li A konečná struktura v konečném jazyce s rovností, potom je teorie Th(A) rekurzivně axiomatizovatelná
tvrzení: pokud je teorie T rekurzivně axiomatizovaná a má rekurzivně spočetnou kompletaci, potom je T rozhodnutelná
nerozhodnutelnost
mějme formuli φ ve tvaru (∃x1)…(∃xn)p(x1,…,xn)=q(x1,…,xn)
kde p a q jsou polynomy s přirozenými koeficienty
věta: neexistuje algoritmus, který by pro danou dvojici polynomů s přirozenými koeficienty rozhodl, zda mají přirozené řešení, tj. zda platí N⊨φ
věta: neexistuje algoritmus, který by pro danou vstupní formuli φ rozhodl, zda je logicky platná (tedy zda je tautologie)
příklady rozhodnutelných teorií
teorie čisté rovnosti (bez axiomů, v jazyce L=⟨⟩ s rovností)
teorie unárního predikátu (bez axiomů, v jazyce L=⟨U⟩ s rovností, kde U je unární relační symbol)
teorie hustých lineárních uspořádání DeLO*
teorie komutativních grup
teorie Booleových algeber
teorie následníka s nulou
Presburgerova aritmetika
příklady nerozhodnutelných teorií
Robinsonova aritmetika (a také Peanova aritmetika a ZFC, což jsou její extenze)