Državno i tako dalje

Danas su napokon objavljena rješenja Državnog natjecanja. Htio sam ih objaviti prije, dok su ljudi još bili pod dojmom državnog. U međuvremenu je održan HIO pa je državno palo u zaborav. Zato sam ja ovdje da ga iz zaborava dignem!

Neki zadatci su, kao i uvijek, rađeni u zadnji čas. Do zadnjeg dana nedostajala nam je ideja za natježi zadatak, onaj koji će biti izazov fantastičnom trojcu (trio fantastikus). Na prethodnom državnom u tu svrhu posudio sam zadatak Пингвиноведение s ruske olimpijade 2015. (koji sam prilagodio i preimenovao u Bitstring) koji ih je namučio, ali su ga riješili. I sad je opet trebalo u nedostatku inspiracije posuditi neki divlji ruski zadatak. (Da, posuditi. Ne brinite, vratio sam im ga.) I budući da se krivac uvijek vraća na mjesto zločina, naravno da sam ovaj put posegnuo za istim natjecanjem, održanim godinu dana kasnije (ruska olimpijada 2016.), točnije za zadatkom Тренажёр, koji sam prilagodio i preimenovao u – pogodite – zadatak Bitstring! Ovaj ih je više namučio i taman je poslužio svrsi. Dodo ga je riješio u zadnji čas, a ova dvojica skoro (miroslav skoro).

Znači, za sljedeću godinu jasno je kako se treba pripremiti. Izvolite, ruska olimpijada 2017. i uživajte!

Najteži zadatak (Bitstring) nije jedini zadatak koji je (po drugi put) inspiriran nekim prethodnim natjecanjem. Takav je i najlakši zadatak, Agenti za prvu podskupinu, koji sam nostalgično složio na osnovi praktički istog zadatka Bard koji se meni u prvom razredu pojavio na županijskom natjecanju. Pa onda, da se ne lažemo, zadatak PN (za obje podskupine) teža je verzija zadatka Nepa sa, pazite sada, ovogodišnjeg Županijskog natjecanja za 5. razred, dok je zadatak Čekaonica (za drugu podskupinu) teža verzija istoimenog zadatka s ovogodišnjeg Školskog natjecanja za 6. razred. Znači, treba ponavljati i starije gradivo.

Zadatak Intervju autora Daniela Paleke lijep je i, pazite sada, originalan, kao i Paljkov zadatak Imaš niz? te moji zadatci Hram i Dva za prvu podskupinu i Tri za drugu. (Inače, zadatak Dva pisali smo nas troje, a zadatak Tri nas dvoje.) Tri smo mogli staviti i u prvu podskupinu umjesto Dva. Moguće je da bi taman napravio razliku između trojice prvaka u 2. razredu, od kojih je jedan riješio Dva pred sam kraj natjecanja. Bolji su nego što smo predmnijevali.

I što učiniti kad tako lijepo i samostalno pripremite zadatke? Napravite si kavu i kokice, zavalite se u stolac, otvorite evaluator i uživate u promatranju nadmetanja:

Ako i dogodine bude ovako napeto, morat ćemo u pripreme uvesti zen meditaciju. Prijave primamo do 1. travnja 2022.

Natjecanje je više od natjecanja

Odlukom AZOO-a, Državno se natjecanje održava u matičnim školama učenika. Vjerojatno je ta odluka s obzirom na epidemiološku situaciju ispravna. Ali motivira me da malo pišem o nekim stvarima koje natjecanje čine onim što jest.

Najprije, Primošten. Već drugu godinu zaredom nećemo uživati u onome što je, meni osobno, postala divna tradicija: svake godine u ožujku otputovati u Hotel Zora i pet dana uživati organizirajući natjecanje tik uz more, a u slobodno vrijeme uživati u šetnjama, kavi i pogledu. Jer tada nema turista (hotel se za nas otvara), sve je tiho i pusto, što je za introverta savršeno; more je doduše hladno, ali ima ona klupa tamo nad stijenama, kad obilaziš poluotok sa starim dijelom grada, na kojoj možeš sjediti satima. (Ima ih nekoliko, ali ona jedna je posebna.)

Ovo je pogled s terase hotela, odmah izvan dvorane za natjecanje:

Zašto ovo pišem? Žalim li se na situaciju, provociram li? Ne, samo dijelim ono što mi je na umu, i želim reći (koliko god to iracionalno zvučalo): za mene je natjecanje i taj Primošten. Bez njega nešto nedostaje. Lako je reći: važan je sadržaj, a ne forma; važna je suština natjecanja; zadatci, rezultati i tako dalje. Primošten je samo “pakovanje” i ukras. Ali baš jučer, u sasvim drugom kontekstu, meni i kolegi mentor je rekao: Forma vam je vrlo bitna u životu – zapamtite to!

Naravno da nije riječ samo o Primoštenu, nego o cijeloj priči: o putovanju pješke na školsko natjecanje, putovanju tramvajem na županijsko natjecanje, pa poslije o pakiranju kofera, dugom putovanju autobusom za Primošten, slušanju glazbe na autocesti, stajanju autobusa na odmorištima kad jedemo sendviče i pričamo o zadatcima ili nečemu desetom, o hotelskoj sobi, doručcima, ručkovima i večerama u hotelu, gotovo neprestanom druženju koje okružuje cijelu priču, a naravno i o otvaranju natjecanja, priredbi lokalnih đaka, govoranciji ljudi u odijelima, pa onda o zatvaranju, proglašenju pobjednika, dodjeli nagrada, naslikavanju, čestitkama, spremanju kofera, ponovno o autobusu, i tako.

Naravno da natjecanje može biti bez većine toga, što je slučaj prethodne i ove godine. Sva natjecanja teoretski možemo odraditi online, nitko ne mora uopće napuštati svoj dom. Jednostavnije, jeftinije i učinkovitije! Ali sami procijenite koliko bi bilo čari u takvom natjecanju. Udobnost je precijenjena; dopustite da to potkrijepim citatom Marka Mansona (izvor je njegov e-mail newsletter):

In the new book, Burkeman has an interesting section about how convenience can backfire. He argues that it’s often the inefficient friction in life that slows us down long enough to actually forge meaningful connections. For example, instead of ordering eight pounds of your favorite meat online, being forced to walk down to the butcher each week and chat to them about weather and business and sports while they cut each slice, week after week, month after month—well, it’s the aggregation of all of these little “inefficient” experiences that generates a sense of community and rootedness in one’s life. By introducing widespread “convenience,” at scale, you remove people’s opportunities to serendipitously engage with the people in their communities.

Po prirodi sam minimalist i nekad prije suprotstavio bih se ovome što sada pišem. Kakve priredbe, kakve govorancije, kakvi ukrasi, glupost! Bio sam jako “racionalan”: kad bih se dopisivao s nekim, moje su poruke bile kratke i informativne; kakvi pozdravi, kakvi smajlići, čemu ta glupava i suvišna pristojnost? Nekad to i ima smisla, mnogo ovisi o kontekstu. Kad je posao u pitanju, kad treba nešto odraditi, onda je poželjno ostati hladne glave i komunikaciju svesti na informaciju, očistiti je od distrakcija. Ali život je više od posla i natjecanje je više od natjecanja.

Jedan moj prijatelj ima običaj na kraju svake svoje poruke djevojci dopisati ni manje ni više nego pet srdaca. Objasnio sam mu da, ako to čini baš u svakoj poruci, srca postaju redundantna jer više ne prenose nikakvu informaciju (nego bi tek njihov izostanak bio nova informacija). Odgovorio je: Naravno, ali nisu redundantna u smislu naglašavanja konteksta. Shvati to kao uživanje u trenutku i formatiranje. Zašto imati stolnjak gdje su svuda nacrtane ruže, dovoljno je staviti ružu na jedan rub i napisati for petlju. Rituali i navike inače mogu biti dosta dobri psihički. Čovjek ima urođenu potrebu za ritualizacijom. Rekao bih čak igrom. Simboli često nisu samo simboli. Zaista, nije važan samo prijenos informacija. Zato što smo, u suštini, životinje; jer je naš primitivni dio mozga stariji i važniji od intelektualnog (vidi npr. ovaj tekst). Je li cijela umjetnost suvišna? Čemu pisati tekst za pjesmu koji se lako prepriča u nekoliko riječi?

Zato je važna ceremonija na početku i na kraju natjecanja. I zato mi je žao onog trenutka kad sam, prije pet ili više godina, metodički pogrešno odgovorio jednom natjecatelju šestog razreda na pitanje tijekom Državnog natjecanja. Naime, na evaluator je stigla njegova poruka o tome da u Pythonu ne uspijeva promijeniti znak u stringu i moli za pomoć. Naravno da mu nisam smio pomoći, ali problem je bio u načinu odgovora. Na međunarodnim natjecanjima, jedan od standardnih načina nepristranog odgovaranja na pitanja natjecatelja bio je korištenjem sljedećih odgovora: “YES“, “NO”, “ANSWERED IN TASK DESCRIPTION (EXPLICITLY OR IMPLICITLY)”, ili “NO COMMENT”. Ovo posljednje je značilo da natjecatelj traži informaciju koju povjerenstvo ne može dati. Ja sam, u skladu s time, odgovorio: “Bez komentara”. Ali mladi natjecatelj gotovo sigurno nije znao da je riječ o jednom od standardnih odgovora. Kada netko inače kaže: “bez komentara”, to često znači da je ostao bez teksta, ta rečenica ima negativan prizvuk i natjecatelj ju je vjerojatno doživio kao opomenu, kao da je u svom pitanju pokazao veliko nezanje/glupost ili bio nepristojan. I možda je to utjecalo na njegovu razinu motivacije. Sada ljepše odgovaram. Neki će reći da cjepidlačim, ali sve je to važno.

I zato mi je žao što je ove godine na Županijskom natjecanju prvi, “motivacijski” zadatak za 1. razred ispao pretežak. I što je na osnovnoškolskim natjecanjima prvi zadatak često pretežak; nadam se da će se to promijeniti. Neki će reći da treba postojati filter, da je dosta popuštanja, da nisu svi za natjecanje i da se mladi trebaju čeličiti. Donekle se slažem, ali zato imamo selekciju na više razine. Primjerice, na “online” Državno natjecanje i dalje ide isti broj ljudi kao i prije pandemije iako su troškovi neusporedivo manji. Što je natjecanje masovnije, manje je prestižno, a time i manje motivira. Potreban je dobar balans između masovnog i elitnog. Zato imamo stepenice. A prva treba biti lagana, jer smisao je natjecanja upravo motivacija. Oni najizvrsniji lako će se snaći kakvo god bilo natjecanje, ali što je s deset tisuća ostalih, što njima želimo? Sigurno ne poručiti im da su loši i da se trebaju baviti nečim drugim. Ljudi su osjetljivi, poticanja i lijepih riječi nikad nije dosta, jer neuspjeha na raznim mjestima – što u stvarnosti, što u glavi – ima i previše.

Refreshaj koliko hoćeš

Jeste li ikad bjesomučno refreshali neku stranicu čekajući neku vijest ili promjenu? (Recimo, popis pozvanih na Državno natjecanje koji se danas očekuje?)

Možda ste znali, a možda i niste, da se to refreshanje može automatizirati.

Postoje online alati za to (recimo, https://www.followthatpage.com/), ali zašto ne bismo zasukali rukave i sami napisali odgovarajuću skripticu?

Ovo je moja:

"""
Usage: refresh.py [full_url] [refresh_interval_in_seconds] [optional: string_to_search]

If the search string is given, then refreshes until the string is found in page text.
Otherwise, refreshes until the page is changed.
"""

import urllib.request
import sys
from time import sleep
from bs4 import BeautifulSoup

def get_text(url):
    text = str(urllib.request.urlopen(url).read())
    soup = BeautifulSoup(text, 'html.parser')
    [s.extract() for s in soup(['style', 'script', '[document]', 'head', 'title'])]
    text = soup.getText()
    # ignore numbers
    for z in '0123456789':
        text = text.replace(z, '')
    return text

try:
    interval = int(sys.argv[2])
    url = sys.argv[1]
except:
    print(f'usage: {sys.argv[0]} [full_url] [refresh_interval_in_seconds] [optional: string to search]')
    exit(0)
if len(sys.argv) > 3:
    word = sys.argv[3]
else:
    word = None
print(f'reading {url} ...')
previous_text = get_text(url)
while True:
    sleep(interval)
    print(f'refreshing {url} ...', end=' ')
    text = get_text(url)
    if word: 
        if word in text:
            print(f'String "{word}" found in page text!')
            exit(0)
        else:
            print(f'string "{word}" not found')
    else:
        if text != previous_text:
            print(f'Page has changed!')
            exit(0)
        else:
            print('no change')
    previous_text = text

Ovaj dio s promjenom ne radi na stranicama s oglasima (npr. portali) jer su svaki put drugačije reklame pa skripta misli da se stranica promijenila. Možda ima i još bugova ili prostora za poboljšanje, slobodno komentirajte.

Napomena: Ne postavljajte refresh interval na manje od nekoliko sekundi; prečesto slanje requestova može biti nepristojno ili čak zabranjeno. Related: https://softwareengineering.stackexchange.com/a/304767

Doživjeti stotu

… ne godinu, nego objavu, naravno! Ovo je stota objava (iliti post) na Blogaritmu.

Kad već brojimo objave, možemo brojiti i ovce, želimo li brže zaspati. Ovo je slika ovaca iz našeg (HSIN-ovog) izvještaja s Međunarodne informatičke olimpijade 2013. održane u Australiji:

Na našim natjecanjima bilo je više zadataka s tematikom ovaca:

  • Najlakši je zadatak Ovce za osnovnu školu.
  • Onda ima i zadatak Ovce za srednju školu.
  • Onda ima i zadatak Klonovi u kojemu se Simona bavi uzgojem ovaca.
  • Ima i zadatak Vode gdje se ovce i koze tuku za pašnjak.
  • Naposljetku je tu i (najteži od navedenih) zadatak Pastiri.

Osim brojenja ovaca, ovce se u našem jeziku javljaju još u nekim frazama. Ponekad se za ljude koji slijepo slijede nešto ili nekoga kaže da su ovce, a onaj tko to kaže obično doda “ja nisam ovca” ili “neću biti ovca”. (Zanimljivo je da nitko ne kaže da je on jedna od tih ovaca, iako bi zapravo “ovce” u tom značenju trebale činiti većinu.) Onda imamo zanimljiv izraz: vuk u ovčjoj koži. Imamo, naravno, i kurac od ovce.

Tu su i neke ljepše metafore: izgubljena ovca u biblijskom smislu, recimo. Imamo u istom kontekstu i dobrog pastira. Ne zaboravimo i Malog princa koji na samom početku, u prvoj svojoj rečenici, prije pozdrava, traži od još nepoznatog prijatelja da mu – nacrta ovcu. A ovaj mu, u bljesku inspiracije, nacrta običnu kutiju:

Image for post

… objašnjavajući da je “ovca koju želiš unutra” – što je malog princa oduševilo. Ali znate već, čitali ste.

Toliko od jubilarne objave, čitajte me i dalje, očekujte nešto pametno, razočarat ću gotovo svaki put.

(posvećeno crnoj ovci)

Kategorizacija blogaritamskih objava

(Ovaj je blog pun digresija; u skladu s time, evo jedne digresije i na početku ove objave – koja, zapravo, ne bi trebala sadržavati digresije jer je njezin smisao u tome da ljudi vide gdje je što. Svejedno, odvucimo i ovdje malo pažnje u nepovrat! Dakle: dosad sam pisao riječ post (u kontekstu blog posta), znajući da je riječ objava pomalo neobična i sadrži (ovdje sasvim nepotrebne) religijske asocijacije. Sad ću ipak u duhu jezika pisati objava, ljepše je. Valjda me i ono malo čitatelja neće zbog toga napustiti.)

Blog sam pokrenuo na prvi april 2018. godine (je li taj datum bio slučajan ili nije, valjda je vrijeme već pokazalo). Krenuo sam pišući o konkretnim zadatcima s informatičkih natjecanja i savjetima za njihovo rješavanje pa su tako nastale kategorije objava poput Tip of the day, Tema dana, Zadatak dana i slično. S vremenom su se pojavile i općenitije objave pa sam napravio i kategorije Razno, Matematika i Natjecanja. Na blogu je sve manje bilo korisnih, stručnih savjeta, a sve više metasavjeta, svakakvih zanimljivosti, filozofije i zajebancije; blog se pretvarao u ispušni ventil mojih misli, kao i svaka dobra umjetnost. (Da, ovo zadnje je šala.) Postojeće kategorije postale su nekako neprikladne: često nema bitne razlike između Teme dana, Zadatka dana i Tip of the day (koji pokriva svašta, od stručnih do metasavjeta), dok su više filozofske objave rasute po kategorijama koje ih dobro ne opisuju.

Odlučio sam stoga napraviti bolju kategorizaciju i podijeliti objave prema novim kategorijama kao u donjem popisu, gdje su objave u svakoj kategoriji poredane kronološki. Podjela, naravno, nije savršena i neke objave su na rubu, tj. mogle su biti i tamo i vamo. Nove kategorije u trenutku pisanja ovog teksta još nisu implementirane u sam blog u svrhu filtriranja objava i slično, ali vjerojatno će biti u nekom trenutku, a i ovaj popis možda ću povremeno ažurirati poveznicama na nove objave. Ako neka poveznica slučajno ne radi ili vodi na krivu objavu, slobodno mi javite, bit ću jako zahvalan.

Algoritmi i zadatci
Put među permutacijama
Tip of the day: Odaberi srednji
Nepotpuno stablo
Kružni intervali
Zadatak dana: Cow School
Tip of the day: disjunktne maske
Tip of the day: logaritamska++
Tema dana: pseudošuma
Zadatak dana: kineski poštar
Zadatak dana: GTA
Tema dana: (m)nogometni problemset
Tip of the day: tablica je bipartitan graf
Tip of the day: permutacija == ciklusi
Zadatak dana: ABCD
Tema dana: podijeli pa vladaj
Tema dana: duguljaste matrice
Tip of the day: if manji if veći
Tema dana: mravlji problemset
Zadatci sa studentskog 2018.
HONI i rješenje kao niz zamjedbi
Dva analogna zadatka
Tip of the day: granice intervala
Tema dana: konstrukcijski zadatci
Dvije stablaste fore
Tip of the day: AB prebrojavanje
Logaritamska struktura i tournament stablo
Tip of the day: broj najkraćih putova i Dijkstrin DAG
Svako stoblo je stablo, ali nije svako stablo stoblo
Kaj su rješavali naši stari
Tema dana: glazbeni problemset
Tema dana: teorija brojeva
Pandemijski problemset
Tema dana: neočekivani graf
Neočekivani graf u još dva zadatka sa stringovima
Tema dana: riješi offline
Tema dana: skakanje po neboderima (ili: Ne pokušavajte ovo kod kuće)

Natjecateljsko programiranje i rad općenito
Uvodni post
Tip of the day: upsolving
Adhocness level
Tip of the day: Codeforces blogovi
Tip of the day: pravilno tipkanje
Tema dana: clear thinking
Tip of the day: CSES Problem Set
Tip of the day: atomske navike
Tip of the day: code review
Tip of the day: YouTube kanali o natjecateljskom programiranju
Kako efikasno vježbati?
Tip of the day: Stjepanovi snippeti
Nabrijavanje za HONI, prvi dio
Nabrijavanje za HONI, drugi dio
Top pet novogodišnjih optimizacija
Algoritmi u Pythonu
Tip of the day: Linux
Iza kulisa HONI-ja
Tip of the day: testiranje zadataka sa HSIN-a
Tip of the day: testiranje na pythonovski
Tip of the day: testiranje
Tip of the day: stari bilteni
Kako vježbati?
Top dvije novogodišnje optimizacije produktivnosti

Iskustva s natjecanja i ostala sjećanja
EJOI 2018. počinje!
Poluosvrt na EJOI 2018.
IOI, IPSC i nestandardni zadatci
Izvor svih zadataka
Digresija: potapanje brodova
Poluosvrt na izborna natjecanja
HONI je bio odličan
Informatika i dopamini
Kako organizirati natjecanje u doba korone
Poluosvrt na vrijeme kada je natjecanje bilo offline
Kako to ide

Matematičke, algoritamske i slične zanimljivosti
Matematika i (neki) matematičari
Digresija: Dedekindovi brojevi
Dokaz ostavljamo čitateljici za vježbu
Izazov godine: kvinijska križaljka
Zadatak dana: kazaljke sata – ili – kad se sve poklopi
Tip of the day: svi su oni isti
AISports i zaigrani botovi
Zadatak dana: Easter eggs ili Čudnovate permutacije uskršnjih jaja
Kampovske igre – članak iz 2011.
Digresija: taksi dijalog
Znanost i algoritmi
Matura, rang liste i College Admissions Problem
Digresija: matematičko-književne preporuke
Ljetna poslastica: dvadeset i jedan (“židovski”) matematički zadatak
Statistika i (neki) statističari
Everybody’s gangsta until you invert
Znanost i algoritmi, drugi dio
Komunikacijska složenost – ili – kako zakodirati partiju šaha

Filozofija?
Digresija: i nula je broj
Digresija: Matematički radio
Može li računalo misliti?
Male tajne velikih brojeva
Jezik i umjetna inteligencija
Digresija: suvišnost matematike i jedna nova igra
Knjiga koja se čita godinama
Beskonačno mnogo vremena
Argument u prilog postojanju dobrog i lošeg ukusa

Ovaj popis sadrži svih dosadašnjih 98 objava. Da, tek sad sam uočio da je ovo devedeset deveta objava. Bilo bi mnogo bolje da je stota. Jebiga.

Kako to ide

Mali pogled petnaestak godina unatrag (uključujući i sve te godine).

U vitrini svoje osnovne škole gledao sam neku pohvalnicu za nečije davno sudjelovanje na regionalnom natjecanju iz matematike. Bio mi je to pojam, sveti gral kojemu sam hrlio. I natjecao sam se iz matematike. U šestom razredu došao sam do tog regionalnog natjecanja, poslije još dalje, bilo mi je to tada najvažnije na svijetu. Gledao sam stare rang liste, razmišljao o opasnoj konkurenciji kojoj sam znao samo imena, pogledavao ih po hodnicima ovog ili onog natjecanja. Polako sam ih upoznavao, mašta je postajala stvarnost, mitska imena postajala su poznata lica, legende su postajale obični ljudi udaljeni tek metar ili dva, normalni i nesavršeni, ni izdaleka onako nepobjedivi kao na starim rang listama. Krenuo sam u Petu gimnaziju, upoznao ih još više, družio se sa sebi sličnijima. Famozni Pjer Mladinić čije sam čitao knjižice i članke u Matki sada mi je, glavom i bradom, predavao matematiku. Legendarni stariji natjecatelj Goran Dražić držao nam je matematičku grupu. Svijet – planet – skupljao se, postajao mi bliži. Svijet matematike i njezinih lica, na početku rasutih po tablicama, a sada bliskih. Od prvih županijskih natjecanja, preko matematičke gimnazije, do olimpijada, i tako dalje…

Kroz gimnaziju to se sve malo i izmiješalo: pojavila se informatika, a i neki drugi interesi. Mijenjao sam raspoloženja i natjecanja bi mi možda sve manje značila da nije bilo međunarodnih olimpijada, novog izvora motivacije. Na tim sam izletima upoznavao strane natjecatelje, od slabijih do najtrofejnijih: igrali smo mafiju i nogomet, pričali o glupostima, svijet se skupljao još više. Najviše se, zapravo, skupio u Kaliforniji gdje smo, već kao studenti druge-treće godine fakulteta, radili na tromjesečnim ljetnim praksama (internship) u tamošnjim softverskim firmama poput Facebooka. Jer tamo, gdje je atmosfera bila zaista divna, u blizini (što firme, što Stanford) našlo se zaista mnogo poznatih lica s matematičkih i informatičkih olimpijada s kojima sam se ponovno imao priliku družiti. Bio sam na vrhu, ima li dalje?

Naravno da se od nekog trenutka stvar prestaje penjati i poprima rjeđe i tiše tonove. Na fakultetu su natjecanja manje važna, postaje ljepše sastavljati zadatke za njih, ali tu se svijet već lagano rasipa. Znanost bi, naravno, mogla postati novo i mnogo važnije natjecanje – ali znanost je drugačija, njome se bavi svatko u svojem laboratoriju, u znoju svoje samoće, više i ne znajući što rade njegovi poznanici. Postoje konferencije, ali tu je socijalni element daleko manji, nije to više to: ljudi su odrasli, grade svoje živote, neki već imaju i obitelj i ne zapljuskuju ih toliko valovi vanjskog svijeta. Znanci iz ove ili one priče gube se po svijetu, po raznim kontinentima, sveučilištima i firmama, više ne pratiš ni one koji su ti bili bliski, a ni one s kojima sada radiš u istoj zgradi. Ego blijedi, radiš svoj posao ili doktorat, ostaje ti vlastiti život i sve manje ljudi koji ti u njemu igraju ikakvu ulogu. U središte dolazi privatni život, na mreži vidiš nekadašnje kolege suparnike kako se udaju/žene, dobivaju djecu, nastanjuju u svoje malene kutke svijeta, čudno ti je da ste se nekad iz nečega natjecali. Svijet koji se prije skupljao sada se rasipa, postaje nevažan, vraćamo se kući.

Komunikacijska složenost – ili – kako zakodirati partiju šaha

Na IOI-u 2010. prvi put smo se susreli s tipom zadatka u kojemu treba poslati neku informaciju u što manje bitova. Zadatak se zvao Saveit i trebalo je, za zadani graf, najkraće udaljenosti (između zadanih posebnih vrhova do svih ostalih) poslati kao bitovni niz iz jednog programa (encoder) u drugi program (decoder) koji će taj niz znati protumačiti, tj. iz binarnog niza rekonstruirati tražene udaljenosti. Trebalo je, naravno, napisati oba programa.

Naivno je rješenje svaku udaljenost poslati kao binaran broj, što rezultira prevelikim ukupnim brojem bitova. Ključna ideja bila je iskoristiti činjenicu da, ako su X i X’ susjedi u grafu, udaljenost(X, Y) razlikuje se od udaljenosti(X’, Y) najviše za 1. Zato je za ovu drugu udaljenost, pod pretpostavkom da smo već poslali prvu, dovoljno poslati samo razliku (-1, 0 ili 1) što možemo dvama bitovima. Ili, još bolje, konstruiramo ternarni niz koji prije slanja pretvorimo u binarni. Detalje ostavljamo čitateljici za vježbu, a cijelo rješenje imate npr. ovdje (napisala ga je moja malenkost, doduše poslije natjecanja).

Tako se na IOI-u pojavila nova tema, koju smo u Hrvatskoj ponekad zvali komunikacijskom složenošću jer se radi o veličini poruka između dvaju programa. Riječ je još i o zadatcima Parrots iz 2011., Supper iz 2012. i Stations iz 2020., a i na CEOI-u 2016. pojavio se zadatak Trick.

Ima to veze i s kompresijskim algoritmima, npr. onima koji smanje veličinu datoteka kad ih zipate, ali za razliku od tih algoritama koji su prilično generički (ne tumače sadržaj datoteka), u ovim problemima traži se kompresija specifična za dani problem. Tako mi je palo na pamet sljedeće pitanje: kako zakodirati partiju šaha, u smislu poteza koji su odigrani? Naravno, pitanje je prilično beskorisno budući da tekstualni zapis šahovske partije nije uopće velik, vjerojatno ste ga i vidjeli (riječ je o Portable Game Notation – PGN), primjerice:

1. e4 e5 2. Nf3 Nc6 3. Bb5 a6 4. Ba4 Nf6 5. O-O Be7 6. Re1 b5 7. Bb3 d6 8. c3 O-O 9. h3 Nb8 10. d4 Nbd7 11. c4 c6 12. cxb5 axb5 13. Nc3 Bb7 14. Bg5 b4 15. Nb1 h6 16. Bh4 c5 17. dxe5 Nxe4 18. Bxe7 Qxe7 19. exd6 Qf6 20. Nbd2 Nxd6 21. Nc4 Nxc4 22. Bxc4 Nb6 23. Ne5 Rae8 24. Bxf7+ Rxf7 25. Nxf7 Rxe1+ 26. Qxe1 Kxf7 27. Qe3 Qg5 28. Qxg5 hxg5 29. b3 Ke6 30. a3 Kd6 31. axb4 cxb4 32. Ra5 Nd5 33. f3 Bc8 34. Kf2 Bf5 35. Ra7 g6 36. Ra6+ Kc5 37. Ke1 Nf4 38. g3 Nxh3 39. Kd2 Kb5 40. Rd6 Kc5 41. Ra6 Nf2 42. g4 Bd3 43. Re6 1/2-1/2

Ali čemu tražiti svrhu, ni većina drugih informatičkih zadataka nije u ovom smislu korisna. Najbolje stvari su beskorisne. Razmislimo onda kako bismo zakodirali ovakav niz poteza u što manju (binarnu ili tekstualnu) datoteku. Želite li se sami zabaviti razmišljajući o tome, slobodno ovdje prestanite čitati…

Na prvi pogled nije lako jako nadmašiti gornji PGN zapis, ali neke redukcije možemo smisliti relativno brzo. Primjerice: nema potrebe navoditi redni broj poteza; moguće je izostaviti i razmake; ne trebaju nam znakovi x (za jedenje) i + (za šah). Moguća su i sitnija poboljšanja: rezultat na kraju može se zapisati samo jednim znakom, a ponekad (npr. u slučaju mata ili pata) on nije ni potreban jer slijedi iz pozicije; rokadu je moguće prikazati jednim znakom; neka jedenja od strane pješaka (npr. hxg5) dovoljno je pisati kao običan potez (g5) ako ne može doći do zabune, tj. ako u tom trenutku ne postoje dva pješaka koji mogu jesti na g5. Tu ideju možemo proširiti i na druge figure pa pisati npr. e1 umjesto Ke1 ako u tom trenutku samo kralj može odigrati na e1. Nisu ta poboljšanja nimalo loša, ali… zasad smo još uvijek vrlo bliski PGN formatu; i dalje nam trebaju 2-3 znaka po potezu. Ako je jedan znak jedan bajt, riječ je o približno 20 bitova po prosječnom potezu. To je nekoliko puta manje od originalnog PGN zapisa, ali može i bolje!

Dobra je ideja odustati od tekstualnog zapisa, od znakova, jer 8 bitova za jedan znak nije dobar deal. Ono što zapravo zapisujemo polja su šahovske ploče, a njih je 64 = 26, što znači da je za zapis jednog polja dovoljno samo 6 bitova. Zapisujemo li potez kao par (početno polje, završno polje), dovoljno je 12 bitova po potezu – mnogo bolje od tekstualnog zapisa! Ipak, postoje i posebni potezi koje nije moguće tako zapisati: mala/velika rokada, završetak partije (kao predaja bijelog/crnog ili dogovoreni remi) ili izvlačenje nove figure gdje treba precizirati izvlači li se kraljica ili nešto drugo. Srećom, možemo se izvući tako da svaki od tih nekoliko posebnih poteza zapišemo kao neki potez koji je inače nemoguć. Recimo, mala rokada može biti zapisana kao da je riječ o potezu a1-b8, velika kao a1-c8, predaja bijelog kao a1-d8, itd. I dalje smo na 12 bitova po potezu!

Slijedi zamjedba da je umjesto početnog polja (6 bitova) bolje zakodirati figuru koja odigrava potez, jer budući da igrač ima samo 16 figura, svaka može biti određena 4-bitnim kodom. Posebne poteze i ovdje možemo zakodirati kao poteze koji su inače nemogući (npr. za bijelog pješak na a1, b1…, a za crnog pješak na a8, b8…). Već smo na 10 bitova po potezu!

Prethodni odlomci navode nas na pomisao da kompresija još uvijek nije optimalna jer postoji nemogući potezi. Ali ne samo potezi koji su uvijek nemogući, poput bijelog pješaka na prvi red ploče ili bjelopoljnog lovca na crno polje, nego i mnoštvo poteza koji su nemogući u danom trenutku partije. Pozicija na ploči, u bilo kojem trenutku, dopušta samo vrlo ograničen skup poteza i nema potrebe koristiti cijeli skup od 210 šahovskih poteza da bismo zapisali što je u tom trenutku odigrano. Drugim riječima, većina kodova uopće ne opisuje dozvoljene poteze i to je očit znak da smo još uvijek rastrošni. To je pogotovo jasno, recimo, na početku partije kada se mogu micati samo pješaci i skakači, ili u završnici kad većine figura više i nema na ploči. Ako je u nekom trenutku samo desetak dozvoljenih poteza, ne bi li nam četiri bita trebala biti dovoljna?

Kako ostvariti tu ideju? Evo kako. Za trenutačnu poziciju odredimo sve dopuštene poteze, sortiramo ih “abecedno” (ili bilo kojim drugim kriterijem), pronađemo onaj indeks u tom nizu na kojem se nalazi potez koji je zaista odigran, i zakodiramo taj indeks. Našao sam na webu podatak (dobiven empirijski) da je prosječan broj dopuštenih poteza u nekoj poziciji približno 31. To znači da bi prosječno 5 bitova trebalo biti dovoljno. Na prvi pogled može biti nejasno kako to iskoristiti jer broj dopuštenih poteza može, naravno, biti i veći – poznata je pozicija iz stvarne partije gdje je taj broj bio 79, a teoretski se on može popeti i do 218 pa nam može zatrebati i 8 bitova. Treba li nam onda neki “separator” koji će dijeliti broj s manje bitova od onog s više bitova? Ne, jer dekoder u svakom trenutku – ako prati poziciju – može znati koliko je dopuštenih poteza, a time i koliko idućih bitova treba pročitati da bi odredio indeks odigranog poteza u tom nizu. Na primjer, ako je 14 dopuštenih poteza, pročitat će četiri iduća bita da otkrije indeks odigranog (makar on bio i 0000).

Dakle, prosječno samo 5 bitova po potezu! Mana je ovog rješenja što i enkoder i dekoder moraju biti programi koji znaju igrati šah, ili barem znaju njegova pravila, jer moraju znati odrediti dopuštene poteze (te ih sortirati po istom kriteriju). Ali čini se da bolje rješenje ne postoji: uočite da svaki proizvoljno dug niz bitova (bio on i slučajan), osim pri samom kraju gdje mu može “nedostajati” bitova, opisuje neku legalnu partiju – što za prijašnja rješenja ni izdaleka ne vrijedi. Ne može bolje! Ili?

Imam i nedovršenu ideju za bolje rješenje. Dosjetka je u tome da, iako pozicija nudi 30ak mogućih poteza, nisu svi jednako vjerojatni: postoje dobri i loši potezi te, što je potez bolji, veća je vjerojatnost da je odigran. To vrijedi i za partije potpunih amatera: u svakoj poziciji postoji značajan broj zbilja besmislenih poteza koje nitko normalan neće odigrati. Kako to iskoristiti? Ovdje nam, nažalost, nije dovoljno da enkoder i dekoder znaju igrati šah. Za ovo rješenje oni bi morali dobro igrati šah, procjenjujući (na jednak način) koliko je koji potez dobar. Pa dobro, to nije neostvarivo, mogu koristiti isti šahovski engine. No što dalje? Umjesto da sortiramo dopuštene poteze po abecedi, sortirat ćemo ih po kvaliteti poteza. Tako će bolji potezi (koji se češće igraju) imati manji indeks pa će za njihov zapis trebati manje bitova. Tako, as a side effect, kvalitetu igrača možemo mjeriti duljinom zapisa njegovih poteza.

No ovdje se javlja problem koji sam natuknuo u jednom od prethodnih odlomaka. Ako postoje, recimo, 32 dopuštena poteza (5 bitova), a odigran je šesti potez po kvaliteti, želimo iskoristiti činjenicu da je indeks mali i zapisati ga koristeći 3 bita. Ali kako će dekoder znati da treba pročitati samo iduća 3 bita, a ne 5? Treba nam, možda, neki separator, ali i on mora biti binaran, i ne smije zauzeti previše bitova… Ako netko ima pametnu ideju kako ovo riješiti, neka napiše u komentar.

Top dvije novogodišnje optimizacije produktivnosti

Na osnovi vlastitog iskustva i raznih tekstova o produktivnosti koje sam vidio po webu ili u knjigama, zaključio sam da su ključna samo dva savjeta.

  1. Do the most important thing first each day.” Za svaki dan (ujutro ili večer prije) odluči koja je najvažnija stvar koju ćeš napraviti toga dana i onda tu stvar napravi odmah ujutro.
  2. Izdrži pet minuta. Kad mi se ne da započeti neki posao, nešto što ću morati raditi satima ili čak danima, onda mi se… well, ne da. Tu je, međutim, prisutna iluzija da će taj osjećaj “ne da mi se” potrajati sve to vrijeme, da ću se sve te sate ili dane morati boriti protiv njega kao što se borim sada na početku. Ali to je uglavnom, kao što sam rekao, iluzija! Jer, čim teškom mukom krenem raditi i izdržim pet minuta, muka najčešće nestaje jer se naprosto ufuram u posao i poslije, dok sam uronjen u posao, ne samo da je osjećaj “ne da mi se” davno nestao nego mi je čak teško stati, toliko da ponekad odgađam ručak ili nešto slično, samo da ne prekinem nit posla koju sam ulovio. Kad napravim posao, bude mi žao što sam prije toga toliko prokrastinirao, što sam toliko odgađao nešto što je zapravo lakše nego što se čini. Poanta glasi: ako ti se ne da, taj će osjećaj najčešće trajati samo prvih pet minuta rada. Izdrži pet minuta!

Kad sam ovo počeo pisati, imao sam na umu tri savjeta (top tri, jel, tko je vidio top dva?), ali zaključio sam da su ova dva dovoljna. Manje je više! Ipak, ako želite više (a tko ne želi više?), proguglajte “calendar blocking”. I ako želite unaprijed isplanirati 2021. godinu, ispunite planer za 2021. godinu s bloga Tee Zavacki o produktivnosti (TeaTime) koji toplo preporučujem. I pogledajte moj sličan post od prije godinu dana.

Poluosvrt na vrijeme kada je natjecanje bilo offline

Prije dvije godine napisao sam Poluosvrt na EJOI 2018. Ako je to bio poluosvrt, dakle pola osvrta, gdje je onda druga polovica? Napisat ću onda sada poluosvrt na EJOI 2017. u Bugarskoj gdje sam bio stručni voditelj. Iako je od tada prošlo više od tri godine, ali eto, slučajno sam naišao na ove fotografije i došlo mi je da se prisjetim kako je to bilo kad natjecanja nisu bila online. (Pola osvrta na EJOI 2018. i pola osvrta na EJOI 2017. daju jedan osvrt na… ne znam što.)

EJOI 2017. bila je prva europska juniorska olimpijada. Ondje sam na nekom bugarskom placu kupio stanovitu frulu s dvije cijevi, dvojanku:

Kupio sam je za dvadeset eura od nekog tipičnog “plac trgovca” koji nije znao engleski pa mi je na bugarskom objašnjavao da je to ozbiljan instrument, da voli Hrvatsku i da je bio u Splitu i na Korčuli. Kako god bilo, kupio bih taj egzotični instrument i da je bio dvostruko skuplji. To je bilo na nekom izletu; pokušavao sam odmah skužiti kako se frula svira i je li slična blok-flauti. Zapitkivao sam okolo ljude jesu li išli u glazbenu školu i mogu li čuti je li interval između dvaju tonova mala ili velika sekunda kad im odsviram. U busu sam uspio približno odsvirati melodiju iz uvoda pjesme Lipe cvatu (ne onu prvu nego onu drugu, normalniju). Nervirao sam ljude, netko me zamolio da prestanem.

EJOI 2017. bilo je jedino natjecanje na kojemu sam se ošišao. Zašto ne, pomislio sam; imao sam vremena i kosa mi je bila zrela za šišanje. Uspio sam se nekako sporazumjeti s frizerkom; ondje iz nekog razloga traže fotografiju kako da te ošišaju. Ošišao sam se vrlo kratko jer je to najbolja strategija kad ne znaš koliko je frizer sposoban. Potom sam u šetnji otkrio predivnu zgradu:

Kad sam je obišao da je bolje pogledam, još sam se više oduševio:

Poslije sam na mobitelu mjerio frekvencije tonova dvojanke. Lijeva cijev nema rupa i daje uvijek isti ton frekvencije oko 485 Hz. Desna cijev ima šest rupa naprijed i jednu iza, a daje tonove frekvencija redom oko 426, 485, 527, 570, 629, 685, 757, 813 Hz pri čemu su mjerenja vrlo neprecizna jer variraju i ovise o jačini daha. Dakle, lijeva cijev kao dron daje osnovni ton, od kojeg s desnom cijevi možemo otići “jedan niže” ili “do šest više”. Međutim, iz frekvencija se vidi da ti tonovi ne odgovaraju našim standardnim tonovima, a ni intervali nisu standardni – omjer frekvencija susjednih tonova te “ljestvice” kreće se otprilike između 1.08 i 1.10, što je točno između male i velike sekunde (1.06 i 1.12), s iznimkom prvog intervala (onog “jedan niže”) koji je oko 1.14. Nema nigdje ni oktave. Precizno sviranje standardnih melodija, dakle, nije moguće, ali zato su moguće drugačije melodije na koje nismo navikli. Druga logika!

Ovdje sam pisao više o stvarima, a manje o ljudima: o druženju, našim i stranim natjecateljima, voditeljima, organizatorima, djevojkama koje su nas vodile uokolo (tzv. gajdice) i slično. O njima neću ništa napisati, dovoljno je podsjetiti da su ljudi još zanimljiviji od frule i zgrada. (U genijalnom tekstu ABBA-ine pjesme The Day Before You Came, pjevačica u detalje opisuje trivijalne sitnice koje su se dogodile prije nego što je došao taj netko, i iako o toj osobi i tom događaju nema ni jedne riječi, o njemu je zapravo cijela pjesma.)

A samog natjecanja i rezultata više se i ne sjećam. Natjecanje je važno, i važne stvari motiviraju život, ali sačinjavaju ga one nevažne, offline sitnice sa strane.

Znanost i algoritmi, drugi dio

Prije nekoliko mjeseci u postu Znanost i algoritmi pisao sam o nekim znanstvenim radovima u kojima glavnu ulogu igraju algoritmi ne toliko različiti od onih na natjecanjima. U međuvremenu sam se sjetio još dvaju dobrih primjera u kojima glavnu ulogu igraju naši algoritmaši. Za početak spomenimo članak u kojem su naši bivši uspješni natjecatelji (Goran Žužić i Filip Pavetić) objavili efikasan algoritam računanja sličnosti stringova. A o drugom primjeru treba napisati nešto više, pa krenimo.

Na 1. kolu HONI-ja 2012. postavio sam zadatak Mars. U njemu je riječ o potpunom binarnom stablu u kojemu možemo proizvoljno zamijeniti lijevo i desno podstablo bilo kojeg vrha – ili, ekvivalentno, odabrati permutaciju listova u kojoj svako podstablo i dalje pokriva uzastopan podniz – tako da zbroj “odbojnosti” susjednih listova (koja je definirana za sve parove u ulaznim podatcima) bude što manji.

Zanimljivo je da sam poslije naišao na znanstvene radove koji rješavaju isti problem. Ovaj članak rješava isti problem za PQ-stablo i primjenjuje ga na poznati problem trgovačkog putnika (Travelling Salesman Problem ili TSP). U ovom članku problem se rješava za K-arna stabla (u binarnom stablu je K = 2) i primjenjuje u bioinformatici za sortiranje gena. Algoritmi i jednog i drugog članka svode se na O(n^3) za binarno stablo, što je i složenost mog rješenja u zadatku Mars.

Ali to nije najbolja moguća složenost! Kao što pokazuje ovaj članak Urlika Brandesa, problem za binarna stabla moguće je riješiti u O(n^2 \log_2 n). Zanimljivo je da je jedan natjecatelj na samom natjecanju pronašao takvo, brže rješenje (o kojem je, dakle, netko prethodno napisao znanstveni rad) – to je bio Luka Kalinovčić na COCI natjecanju. Nakon što sam proučio njegovo rješenje, opisao sam ga (uz vlastito) u službenim rješenjima, tada još ne znajući za cijelu ovu priču. Svaka čast Luki!

Spomenimo i da navedeni Brandesov članak navodi još neke primjene ovog problema kao što je sortiranje piksela u svrhu sažimanja slika, te je predloženi algoritam zbog memorijske složenosti od O(n) bolji od algoritma iz članka koji se izvorno bavi tim praktičnim problemom.