cviceni | uvod-do-strojoveho-uceni

this dir | view | cards | source | edit | dark top

poznámky
- bacha na čísla verzí u Pythonu a balíčků
- používat pole v numpy
lineární regrese
- dvě možnosti
  - explicitní
    - pozitiva: přesnost
    - negativa: outliers dělají problémy
  - SGD
    - pozitiva: méně paměti, regularizace
    - negativa: globální optimum nezaručeno
- SGD + momentum
  - https://distill.pub/2017/momentum/
- AdaGrad
- AdaDelta
- Adaptive Moment Estimation (ADAM)
co máme
- data $(x,y)\in\mathbb R^2$
- model $f(x)=y,\;f:\mathbb R\to \mathbb R$ $f (x) = y, f : R \to R$
  - při lineární regresi konkrétně $y=ax+b$
- parametry $\theta=(a,b)\in\mathbb R^2$
- predikce $f_\theta(x)=y,\;f:\mathbb R^3\to \mathbb R$
- loss $L(\theta,(x,y)),\;L:\mathbb R^4\to \mathbb R$
$\text{softmax}(x)_i=\frac{e^{x_i}}{\sum_{k=0}^n e^{x_k}}$
$f(x)_i=\frac{|x_i|}{\sum|x|}$ $f (x)_{i} = \frac{∣ x _{i} ∣}{\sum ∣ x ∣}$
- prohodilo by se pořadí (jelikož záporná čísla by se zobrazila mezi kladná čísla)
$f_2(x)_i=\frac{x_i-\min(x)}{\sum|x-\min(x)|}$ $f_{2} (x)_{i} = \frac{x _{i} - m i n ( x )}{\sum ∣ x - m i n ( x ) ∣}$
- u minima by to byla nula, což by nám znemožnilo např. u dvojprvkového vektoru vyjádřit nejistotu
poissonovská regrese – viz slidy z roku 2022/2023
- lze použít k řešení soutěžní úlohy
time splines
- něco jako one hot
- úterý kóduju tak, že dám např. 0.8 úterý, 0.1 pondělí a 0.1 středě
nástroje k soutěžím
- one-hot
- RobustScaler
- polynomial
- regLR
  - increased maxiter
- spline transformer
- power transformer
- https://scikit-learn.org/1.5/auto_examples/preprocessing/plot_all_scaling.html
https://stats.stackexchange.com/questions/507207/deriving-the-backpropagation-matrix-formulas-for-a-neural-network-matrix-dimen
další nástroje
- ansámbl několika MLP, které hlasují
- scale, pad, crop, rotate
- early stopping, když loss na validačním setu neklesá
analýza výkonu
- modul cProfile
- cProfile.run('kód')
- python -m memory_profiler
diakritizace
- dva přístupy
  - marks – je to s diakritikou nebo bez?
  - letters – přímo písmeno
    - model může pro "o" vrátit "ú"
  - obecně jsou letters lepší
- jako one-hot
- kontext (n písmen na každou stranu)
- pořadí písmen je vždycky stejné → nemá smysl ho kódovat nějak jinak (u hlubokého učení by to smysl dávalo)
- n-gramy
  - příklad
    - slovo kocka
    - pro písmenko c:
      - bigramy: oc, ck
      - trigramy: koc, ock, cka
  - zase se kódujou one-hot