<3 python

ilyet kell szamolnom eppen:

pythonban ennyi:


def genSumList(U, state, probability):
        return R(state) + max([sum([probability * U[newState] for (probability, newState) in T(state, action, probability)]) for action in actions(state)])

(nem a konkret szamolas szamit, hanem hogy milyen szepen le lehet irni generatorokkal, es utana max/summal osszerakni...
es tudom, hogy a python kodom nem _pont_ ugyanazt szamolja ki, de higyjetek el, ez annak az altalanos esetnek egy picit specialisabb esete)

Hozzászólások

A szumma lebegőpontos? Mert ha igen, akkor a hiba mérsékeléséhez érdemes lehet prioritásos sorral összegezni. (A két legkisebbet (legkisebb abszolútértékűt) kivenni, összeadni, az összeget visszarakni.) Ezt csak azért mondom, mert tegnap este eszembe jutott. Persze fogalmam sincs, hogy a python a listát hogyan összegzi (főleg, ha nincs is kész lista, csak egy generátor).

Ezen kívül, ha jól értem, a

probability

-t két scope-ban is használod (eltérő jelentéssel), ami pedig ejnye :)

Tördelni nem lehet egyébként?, ütközik a python indentálási szabályaival? Nekem így könnyebb olvasnom:


def genSumList(U, state, probability):
  return R(state) + max([
    sum([
      probability * U[newState]
      for (probability, newState) in T(state, action, probability)
    ])
    for action in actions(state)
  ])

karbantarthatosag szempontjabol tenyleg nem szep dolog, hogy reuseoltam a nevet, de bugot nem okoz, a legkisebb ertelmes scopeban oldodik fel.

hiba nincs a lebegopontos dolgok korul szerencsere, Decimal -t hasznalok, nem hagyomanyos lebegopontos szamokat :)

(jol meg is szivtam, 5 es fel oram ment csak ra, hogy kidebuggoljam, hogy a Decimal('0.45') meg a Decimal(0.45) nem ugyanaz...)

Jo dolog is a Reinforcement Learning.

Amugy ja, nem ritka, hogy pszeudokod meg a Python kod igen hasonlo :).

van kulon matematika "intezetunk"/"osztalyunk" is (department) a ZRL-ben, de engem sosem kotott le annyira az MI/optimalizalas, hogy azzal toltsem a mindennapjaim.

en konkretan a computer science department - security research groupban vagyok, cloudokkal, illetve virtualis adatcenter biztonsaggal foglalkozom

en vagyok az utolso evfolyam (2005) :-)

2010-ben meglett a programozo matematikus diploma, de a munkahelyemen ez lofutty, igy most teperek, hogy meglegyen az egyetemi is most juniusban.

mellesleg vannak, akik meg analizis 6-on ulnek az ETR szerint, na, ok leghamarabb jovore diplomazhatnak... :)

Ilyesmire a Wolfram Mathematica-t preferálom. Persze csak ezért nem venném meg. :)