Tämä kirjoitus on niin sanottu FAQ. Tämä kirjainlyhenne tulee englanninkielen sanoista "Frequently Asked Questions", 'usein esitettyjä kysymyksiä'. Niinpä tämä kirjoitelma pyrkiikin vastaamaan usein esitettyihin kysymyksiin, sellaisiin, jotka pidemmän päälle toistuessaan alkavat kyllästyttää keskusteluareenan vakiosallistujia.
Tämä kirjoitelma on keskusteluryhmän sfnet.atk.ohjelmointi.alkeet
FAQ.
Vaikka tuo ryhmä onkin varsin nuori, perustettu loppukeväästä 1998, on
siellä ehditty jo kaluta muutama aihe kyllästymiseen asti. Siksi tämä
kirjoitelma on olemassa: jotta ryhmän uudet lukijat saisivat vastauksen
polttaviin kysymyksiinsä, joista ryhmän vanhat parrat eivät jaksa enää
keskustella. Lienee hyvä mainita, että se, että jotakin asiaa
käsitellään tässä kirjoituksessa, ei tarkoita, että se olisi jotenkin
erityisen tärkeää tai toisaalta jotenkin tarpeetonta asiaa.
Tämä kirjoitelma postataan kerran kuukaudessa uutisryhmään
sfnet.atk.ohjelmointi.alkeet
. Uusin julkaistu versio on myös
saatavilla seitistä seuraavissa muodoissa:
HTML, tavallinen
teksti, teksti
korostuksin ja
SGML/Debiandoc.
Viimeksimainitun käsittelemiseen tarvitaan
Debiandoc-SGML-paketti,
joka toiminee ainakin kaikissa Unixeissa.
Tätä kirjoitusta ylläpitää Juha Autero [email protected]. Suurimman osan kirjoituksesta on kuitenkin tehnyt Antti-Juhani Kaijanaho, joten kirjoituksen "minä" on poikkeuksetta Antti-Juhani, mutta mukana on myös muidenkin kirjoittajien tekstiä. Juha ottaa vastaan tähän kirjoitelmaan liittyviä kommentteja, korjauksia ja muita sellaisia. Kirjoitelmaan tehdyt muutokset löytyvät GNU ChangeLog sekä HTML-muodossa.
Uutisryhmät ovat kokonaisuutena vanha keskusteluareena, itse asiassa paljon vanhempi kuin useimmat verkon käyttäjät tulevat ajatelleeksi. Tiedossani ei ole tarkkaa tietoa siitä, koska uutisryhmiä levittävien palvelimien verkko Usenet syntyi, mutta se on ollut olemassa nyt jo ainakin 15 vuotta. Osa nykyisistäkin keskustelijoista olivat paikalla jo silloin, maailmankaikkeuden hämärinä alkuhetkinä. Näin vanhalle areenalle on aikojen saatossa syntynyt oma hyvän käytöksen normisto, jota aloittelevankin kirjoittajan on syytä noudattaa jos ei halua saada verkossa peelon eli idiootin mainetta. Tämä netti-etiketti eli netiketti ei ole kovinkaan monimutkainen, ja terveellä järjellä pärjää hyvin.
Tärkeintä on se, että kirjoittaessasi uutisryhmään ilmaiset itseäsi selkeästi. Tässä muutamia nyrkkisääntöjä: Kirjoita yleiskieltä ja vältä sellaista erityissanastoa, jota ryhmän lukijakunta ei todennäköisesti tunne. Jos kirjoituksessasi esitetään kysymys, johon halutaan vastaus, esitä kysymys selkeästi ja mielellään kirjoituksesi alkupuolella. Kirjoita lyhyesti mutta älä liian lyhyesti. Pyri aina siihen, että kirjoituksesi sanoo jotain olennaista keskustelun kohteena olevasta asiasta. Käytä paljon puhuvia otsikoita; mitäänsanomattomasta subject-rivistä ei ole kenellekään mitään hyötyä. Esimerkiksi ''Scheme: Merkkijonon pituus'' on paljon hyödyllisempi otsikko kuin ''Auttakaa!''. On epäkohteliasta kysyä ryhmässä ja vaatia vastaukset sähköpostitse.
Muista aina kertoa mitä ohjelmointikieltä käytät. (Esimerkiksi C, C++ ja Java eivät välttämättä eroa toisistaan lainkaan pienessä esimerkkikoodissa.) Kerro myös ympäristö ja kääntäjä. Esimerkiksi C-kielessä ei ole mitään standardin mukaista tapaa tyhjentää ruutu, vaan vastaus on erilainen Borland C++ Builderilla konsoliohjelmia tehtäessä ja Linuxin gcc-kääntäjällä.
Lisää tietoa netiketistä saa Timo Kiravuon kirjoituksesta News-etiketti ja Jukka Korpelan kirjoituksesta Nyysiopas. Kumpikin ovat suositeltavaa luettavaa kaikille uutisryhmiä seuraaville.
Uutisryhmän sfnet.atk.ohjelmointi.alkeet
virallisen kuvauksen mukaan
se "on tarkoitettu ohjelmointia aloitteleville tai sellaisille, jotka
tutustuvat itselleen uuteen ohjelmoinnin osa-alueeseen". Ryhmässä
käsitellään siis erilaisia alkuunpääsemisen ongelmia. Muunlaisia
ohjelmointiongelmia varten on olemassa ryhmä
sfnet.atk.ohjelmointi.moderoitu. Hyvä
nyrkkisääntö on, että mikäli kysyjä on ohjelmoinut alle vuoden verran,
on alkeet-ryhmä todennäköisesti oikea valinta. Toiseen suuntaan ohje ei
päde, sillä kokeneempikin ohjelmoija saattaa joskus törmätä
alkeisongelmiin, varsinkin tutustuessaan uuteen ohjelmointikieleen tai
-metodiin. Toinen hyvä nyrkkisääntö on se, että mikäli kysyjä ei itse
tiedä, mistä päin nettiä tai kirjallisuutta lähtisi etsimään vastausta,
kysymys on mahdollisesti alkeista.
HTML-kieleen liittyvät kysymykset eivät kuulu mihinkään
ohjelmointiryhmään, sillä HTML ei ole ohjelmointikieli. Esitä ne
mielummin WWW-kysymyksille varatussa ryhmässä sfnet.viestinta.www
, kun
olet ensin tarkistanut, ettei kysymykseesi ole vastattu ryhmän
VUKK:ssa tai englanninkielisessä
FAQ:ssa.
Ennen kysymyksen lähettämistä uutisryhmään tarkista, ettei kysymykseesi ole vastattu tässä kirjoituksessa tai moderoidun ohjelmointiryhmän FAQ:ssa.
Kysymys siitä, millä ohjelmointikielellä kannattaisi aloittaa ohjemoinnin opettelu, on oikeastaan mielipideasia; jokaisella on oma mielipiteensä siitä. Esitän (AJK) tässä oman näkemykseni, ja pyydän muita kokeneita ohjelmoijia - ja erityisesti ohjelmoinnin opettajia - kirjoittamaan oman mielipiteensä ja lähettämään sen minulle, jotta voisin esittää tässä kirjoitelmassa mahdollisimman monipuolisen vastauksen kysymykseen.
Ensimmäisen ohjelmointikielen valinnalla ei yleensä ole maata järisyttävää merkitystä, mikäli opettelija aikoo käydä opintien loppuun asti eli ruveta ammattimaiseksi tai vakavasti harrastavaksi ohjelmoijaksi. Tällainen ihminen nimittäin kyllä ennemmin tai myöhemmin joutuu opettelemaan suurimman osan yleisessä käytössä olevista ohjelmointikielistä. Tärkeintä ohjelmoinnin opettelemisessa on tällaisen ihmisen kannalta ajattelutapojen ja ongelmanratkaisun oppiminen, ja suurin osa nykyisin käytössä olevista ohjelmointikielistä kyllä mahdollistavat tämän. Mikäli opettelijalla ei kuitenkaan ole näin voimakasta kunnianhimoa, kielen valinnalla on suurempi merkitys.
Sanoin äsken, että tosissaan ohjelmointia harrastava ihminen joutuu opettelemaan ennemmin tai myöhemmin kaikki yleisessä käytössä olevat kielet. Tätä ei pidä pelästyä: yleensä ensimmäinen kieli on kaikista vaikein, sillä sitä opetellessa joutuu samalla oppimaan myös ohjelmoimaan - ja ohjelmointihan on kaikkea muuta kuin kielen yksityiskohtien osaamista. Annanpa esimerkin itsestäni. Ensimmäisen kieleni opettelin joskus 1990-luvun alkussa. Minulla kesti kauan, ennen kuin opin tekemään sillä jotain hyödyllistä. Syksyllä 1998 opettelin Python-kielen muutamassa päivässä samalle tasolle, jonne pääseminen ensimmäisellä kielelläni kesti vuosia; python taisi olla minulle viides kieli, jonka opettelin kunnolla. Voin vain toistaa itseäni ja sanoa: kielet helpponevat sitä mukaa kun ohjelmointikokemus karttuu.
Väitän, että BASIC-kieli sellaisena kuin se esiintyy 1980-luvulla yleisesti käytetyissä kotitietokoneissa (esim. Commodore 64, Sinclair Spectrum ja varhaiset IBM PC -yhteensopivat tietokoneet), on täysin sopimaton aloittelevalle ohjelmoijalle. Kielestä puuttuvat nimittäin kaikki hyvää ohjelmointityyliä tukevat ominaisuudet, ja tämän mikrobasictaustan omaava ohjelmoija joutuu ennemmin tai myöhemmin opettelemaan pois tämän kielen tuomista pahoista tavoista, mikä ei ole ollenkaan helppo homma. Vastaava ongelma on kaikilla konekielillä. Nykyisin käytössä olevat BASIC-murteet ovat jo käyttökelpoisempia.
Hyviä aloituskieliä ovat Scheme, Python, Prolog, Java, Pascal ja C++. Muitakin kelpo kieliä on. Käsittelen nyt kutakin nimeltä mainitsemaani kieltä erikseen.
Scheme : Scheme on 1970-luvulta peräisin oleva kieli, jota käytetään nykyisin varsin paljon korkeakouluissa ja yliopistoissa ensimmäisenä opetuskielenä - esimerkiksi Teknillisen korkeakoulun pääaineopiskelijoilla Scheme on pakollinen ensimmäinen ohjelmointikieli. Kielessä on hyvin vähän opeteltavia yksityiskohtia, ja siksipä Schemeä käytettäessä päästään nopeasti käsiksi tärkeämpiin asioihin. Scheme kuuluu epäpuhtaiden funktionaalisten kielten luokkaan, minkä vuoksi joillakin on sitä kohtaan turhia ennakkoluuloja. Mikäli minua pyydettäisiin suosittelemaan ohjelmoinnista tosissaan kiinnostuneelle aloittelijalle jotain kieltä ensimmäiseksi ohjelmointikieleksi, suosittelisin Schemeä.
Scheme-materiaalia on verkossa varsin paljon, lähinnä englanniksi.
Hyviä aloituspaikkoja ovat [Schemers.org](http://www.schemers.org/)
ja suomalainen vaan ei suomenkielinen [Schememonster's
friends](http://www.niksula.cs.hut.fi/%7Ecandolin/scheme/). Schemeä
käyttäviä, aloittelevalle ohjelmoijalle sopivia kirjoja on myös,
lähinnä englanniksi.
Python : Python on Schemeä huomattavasti nuorempi ohjelmointikieli. Pythonin kielioppi on johdonmukainen ja sisältää vähän opeteltavia yksityiskohtia. Kieli tarjoaa runsaasti valmiita työkaluja monien käytännön ohjelmointiongelmien ratkaisemiseen nopeasti ja vähällä kirjoittamisella. Tämän vuoksi se sopii hyvin sellaiselle aloittelevalle ohjelmoijalle, joka haluaa saada nopeasti hyvin toimivia ohjelmia aikaiseksi. Pythonin pahin ongelma on se, ettei siitä ole olemassa kunnollista kirjallista materiaalia aloittelevan ohjelmoijan käyttöön.
Kaikki olennainen Pythonista on luettavissa kielen
[seittisivustolta](http://www.python.org/).
Prolog : Prolog on varsin omintakeinen ohjelmointikieli. Se perustuu muodolliseen logiikkaan ja päättelysääntöihin: kun Prologille kerrotaan, että Matti on Maijan poika, Mikko on Matin poika ja pojan poika on pojanpoika, niin Prolog osaa vastata kysymykseen "Onko Mikko Maijan pojanpoika?" oikein. Prolog poikkeaa muista kielistä siinä, että vain Prologissa tämä ongelma voidaan esittää suurin piirtein yhtä yksinkertaisesti kuin suomen kielessä. Prolog on hyvä kieli sellaiselle, jota kiinnostavat älylliset pelit ja kielelliset ongelmat.
Prolog-materiaalia on netissä, mm. [Prolog Programming A First
Course](http://www.cbl.leeds.ac.uk/%7Epaul/prologbook/), [A Short
Tutorial on
Prolog](http://www.cbl.leeds.ac.uk/%7Etamsin/prologtutorial/) ja
suomeksi [Keskeneräisiä harjoituksia Prolog-ohjelmointikieleen
tutustumiseksi](http://www.ling.helsinki.fi/courses/ctl170/1998/).
Heikki Kantola on suositellut seuraavia Prolog-kirjoja: W.F.
Clocksin, C.S. Mellish: ''Programming in Prolog'', L. Sterling, E.
Shapiro: ''The Art of Prolog'' ja F. Pereira, S. Shieber: ''Prolog
and Natural-Language Analysis''.
Java : Java on eri asia kuin seittisivuilla varsin usein nähtävä Javascript. Java on hyvin uusi mutta lupaavalta näyttävä ohjelmointikieli, joka on sukulaistaan C++:aa huomattavasti ystävällisempi käyttäjäänsä kohtaan. Kielen soveltuvuudesta aloittelijalle kertoo jotain se, että Helsingin yliopiston Tietojenkäsittelytieteen laitos käyttää Javaa ensimmäisenä opetuskielenään.
Helsingin yliopistossa aloitteleville ohjelmoijille pidettävää
Java-kurssia luennoiva Arto Wikla on kirjoittanut kurssin
luentomateriaalin pohjalta kelpo kirjan (Arto Wikla: Ohjelmoinnin
perusteet Java-kielellä, OtaDATA 1998), joka sopii aloittavalle
ohjelmoijalle. Yksityiseen käyttöön on saatavilla kirjan kanssa
samaan materiaaliin perustuva
[seittisivusto](http://www.cs.Helsinki.FI/%7Ewikla/JohdOhj/JaOh/),
jota Wikla käyttää Java-kurssinsa kurssimateriaalina ja joka siksi
soveltuu hyvin aloittelevan ohjelmoijan luettavaksi.
Pascal : Pascal on kehitettiin 1970-luvulla opetuskieleksi. Sitä käytettiinkin paljon opetuksessa pitkälle 1990-luvulle asti. Alkuperäisessä ja standardoidussa muodossaan kieli on kuitenkin aivan liian rajoittunut eikä sillä voi tehdä mitään todellisia ohjelmia. Sittemmin erityisesti entinen Borland, nykyinen Inprise on kunnostautunut Turbo Pascal ja Delphi-murteillaan niin, että nämä Pascaliin perustuvat ohjelmointikielet ovat DOS- ja Windows-ohjelmoijien laajassa suosiossa. Ihmiselle, joka aikoo opetella vain yhden kielen ja joka käyttää DOSia tai Windowsia, Turbo Pascal ja Delphi ovat oikein hyviä ohjelmointikieliä.
Jori Mäntysalo on kirjoittanut perusteluja sille miksi [pascal sopii
ohjelmoinnin
opiskeluun](http://www.uta.fi/%7Ejm58660/jutut/ohjelmointi/pascal.html).
Seitistä löytyy [pascal-opas](http://www.tuug.utu.fi/%7ef/pascal/).
C++ : C++ on kulttikieli, siitä ei pääse yli eikä ympäri. Se perustuu toiseen kulttikieleen nimeltä C, joka kehitettiin 1970-luvulla konekielen korvaajaksi käyttöjärjestelmäohjelmointikäyttöön. C++ on järkyttävän iso kieli, ja sen kaikkien yksityiskohtien muistaminen on käytännössä mahdotonta. Kaikesta huolimatta sekä C:tä että C++:aa opetetaan aloitteleville ohjelmoijille monissa yliopistoissa ja korkeakouluissa (Jyväskylän yliopisto yhtenä esimerkkinä). Itseopiskelijalle C++ on luultavasti liian hankala ensimmäiseksi kieleksi.
C++-kirjallisuutta on myynnissä uskomattomia määriä. Monetkaan
kirjat eivät ole kovin kaksisia, ja asiavirheet eivät ole
tavattomia. Aloittelijalle hyvä kirja lienee Jesse Libertyn ''Opeta
itsellesi C++'' (alkuteos ''Teach Yourself C++ Programming in 21
Days''), vaikka sekään ei ole virheetön.
Netistä löytyy myös [C++-opas](http://www.nic.funet.fi/c++opas),
joka kevyestä kirjoitustyylistään huolimatta sisältää painavaa
asiaa.
Mikäli et tunne kumpaakaan kieltä ennestään ja sinulla on mahdollisuus valita, opettele ensin C++. Näin et joudu oppimaan eräitä pahoja tapoja, jotka C:ssä tarvitaan kielen suppeuden vuoksi; jos joskus joudut tekemään C-ohjelmia, nämä kiertoreitit on opittavissa varsin helposti C++-taustalla. Asiaa käsittelee myös C++-FAQ Lite, kysymys 28.2.
Opettele ohjelmoinnin alkeet käyttäen jotain edellä esiteltyä kieltä. Sitten tutustu esimerkiksi kirjoitukseen Laaman tie peliohjelmointiin, joka olettaa C-kielen hallinnan sekä siedettävän laskutaidon.
Tämä riippuu monesta asiasta. Käyttämässäsi ohjelmointikielessä voi olla valmiita keinoja kuvan laittamiseen. Mikäli näin ei ole, etkä voi käyttää valmiita ohjelmakirjastoja, sinun täytyy piirtää kuva itse ruutuun käyttäen ohjelmointikielesi grafiikkakirjastoa.
Edellä mainittu Laaman tie peliohjelmointiin sisältää joitakin ohjeita.
On melkeinpä vale puhua satunnaisuudesta samassa yhteydessä
ohjelmointikielten erilaisten rand-käskyjen tai -kirjastoaliohjelmien
kanssa. Näiden tuottama satunnaisuus on näennäistä: takana on täysin
toistettavissa oleva matemaattinen metodi, joka pyrkii tuottamaan
suhteellisen satunnaisilta näyttäviä lukuja. Yksi tämän aiheuttama
ongelma on se, että generaattori on alustettava. Alustustapa riippuu
kielestä; kohtuuhyvä metodi on uudehkoissa Pascal-murteissa
randomize
-käsky sekä C:ssä srand(time(0))
(tässä tarvitaan
stdlib.h
- ja time.h
-headerfileitä).
On ehkä liiankin hyvin opetettu ihmisiä sanomaan ``randomize'' tai ``srand(time(0))'' (tai mikä se nyt milläkin kielellä onkaan), jotta satunnaislukugeneraattori antaisi hyvän tuloksen. Nimittäin on helppo ymmärtää tämä väärin, loitsu lausutaan joka kerta, kun halutaan satunnaisluku. Esimerkki virheestä tuottaa ajettaessa mainitun tuloksen.
Pääsääntö on yksinkertainen: Käytä satunnaisluvun alustajaa (randomize, srand tms) vain kerran ohjelmassa. Yleensä hyvä paikka tälle on juuri ohjelman alussa. Käytä alustajaa useita kertoja vain, jos ymmärrät sekä ohjelmointitekniikan että tilastomatematiikan kannalta, mitä olet tekemässä.
VAROITUS: Tässä annettu vastaus voi olla väärä. Keskustele oman satunnaisuuden asiantuntijasi kanssa ennen kuin käytät tässä annettuja ohjeita.
Tyypillinen standardikirjastossa oleva satunnaislukugeneraattori palauttaa joko kokonaisluvun joltakin ennalta määrätyltä väliltä taikka sitten liukuluvun nollan ja ykkösen välistä. Yleensä kuitenkin kaivataan satunnaista kokonaislukua joltakin tietyltä väliltä.
Jos kirjaston satunnaislukugeneraattori palauttaa liukuluvun f, jonka
tiedetään olevan välillä 0 <= f < 1
, on suhteellisen yksinkertainen
tapa skaalata tämä halutulle välille MIN <= f' < MAX
kaavan
`f' := (MAX - MIN) * f
- MIN
käyttäminen. Tässä toki pitää käytetyn liukulukutyypin olla riittävän tarkka. Jos haluat tuloksen olevan kokonaisluku väliltä
MIN...MAX, käytä kaavaa
tulos := int( (MAX - MIN -
-
- f) + MIN
, missä funktio
int` tekee liukuluvusta kokonaisluvun katkaisemalla (poimimalla suurimman kokonaisluvun, joka ei ole suurempi kuin kyseinen liukuluku).
- f) + MIN
-
Mikäli satunnaislukugeneraattori palauttaa kokonaisluvun väliltä
0...RAND_MAX
ja haluat tulokseksi liukuluvun väliltä
MIN <= tulos < MAX
, voit käyttää kaavaa
tulos := double(MAX - MIN) / (RAND_MAX + 1) * f + MIN
. Jos haluat
tuloksen olevan kokonaisluku väliltä MIN...MAX
, ongelma on hankalampi:
mikä tahansa skaalaustapa saattaa tehdä huonoa satunnaislukujen
satunnaisuudelle. Käytetyin tapa, jakojäännöksen ottaminen, suosii
satunnaisluvun alimpia bittejä ja (mikäli generaattori on huono, kuten
valitettavan usein on) saattaa jopa tuhota saatavien lukujen
satunnaisuuden täysin. Hieman parempi tapa on käyttää "Numerical Recipes
in C" -kirjan (Press, Flannery, Teukolsky ja Vetterling; Cambridge
University Press, 1992) ohjetta ja käydä liukulukujen kautta. Tämä
metodi toimii C:llä kirjoitettuna seuraavasti:
MIN + (int)((MAX - MIN + 1.0) * rand() / (RAND_MAX + 1.0))
missä MAX
ja MIN
ovat halutun luvun ylä- ja alaraja, ja RAND_MAX
satunnaislukugeneraattorin rand()
tuottama suurin kokonaisluku (pienin
on nolla). Tämän metodin hankaluutena on liukulukujen käytön aiheuttama
laskentaepätarkkuus.
Toinen tapa on seuraava: Toinen tapa on seuraava: Olkoon ensin N := MAX - MIN + 1
ja RM := RAND_MAX + 1
(missä RAND_MAX
on suurin luku,
jonka satunnaislukugeneraattori tuottaa). Jaetaan väli 0..RAND_MAX
N+1
:een osaan, joista N
ensimmäistä ovat yhtä pitkiä. Viimeinen osa
saa olla tyhjä. Viimeisestä osasta kannattaa tehdä lyhyt, mutta sen ei
välttämättä tarvitse olla lyhyin mahdollinen. Sitten tuotetaan
valesatunnaislukuja kunnes tulos f
osuu johonkin muuhun kuin
viimeiseen osaan eli f literal>, ja palautetaan . Valmis C-koodi löytyy Niemitalon artikkelista ().
Edellämainituissa menetelmissä täytyy halutun välin pituuden olla
enintään RAND_MAX
.
Vielä yksi tapa on käyttää omaa satunnaislukugeneraattoria. Tässä pitää olla todella tarkkana: on helppoa keksiä surkea satunnaislukugeneraattori ja vaikeata keksiä hyvä sellainen. Satunnaiseen (!) käyttöön sopivan C-kielisen generaattorin on kirjoittanut Antti Valmari, ja se on saatavissa verkosta.
Lottoriviä arvottaessa olennaista on, että samaa lukua ei arvota kahta kertaa. Tätä ei pidä toteuttaa arpomalla joka kierroksella luku väliltä 1..39 ja hylkäämällä jo arvotut numerot. Tuo nimittäin voi johtaa umpiluuppiin.
Hyvä ja yksinkertainen lottorivin arvonta-algoritmi on tässä (kiitokset
Kimmo Surakalle): Kootaan taulukkoon kaikki 39 lukua, joista arvonta
suoritetaan. Arvotaan ensimmäinen luku hakemalla satunnaisluku väliltä
1..39 ja katsotaan, mikä luku tämän numeron osoittamassa kohdassa on: se
on ensimmäinen lottonumero. Poistetaan tämä numero taulukosta, ja
arvotaan luku väliltä 1..38, jonka taulukosta osoittama luku on seuraava
lottonumero, joka poistetaan. Toistetaan, kunnes kaikki seitsemän
numeroa on arvottu. Algoritmin C-kielinen toteutus löytyy Surakan
alkuperäisestä nyysiartikkelista
<[email protected]>
(Google: Re: Lotto
C++:lla),
jossa on pieni virhe: ohjelman kolmanneksi viimeinen ja toiseksi
viimeinen rivi pitää vaihtaa.
Ennen pitkää törmätään tilanteeseen, jossa halutaan käsitellä useita
samantyyppisiä tietoalkioita - kuvia näytöllä, lukumääriä listassa,
sarakkeita tiedostosta luettavasta tietueesta yms. - yhtenä
kokonaisuutena. Usein päädytään ratkaisuun jossa tietoalkiot nimetään
tyyliin kuva1
, kuva2
, kuva3
, ja näitä käsitellään yksitellen.
Esim:
tyhjenna_kuva( kuva1 )
tyhjenna_kuva( kuva2 )
tyhjenna_kuva( kuva3 )
Ratkaisu on sinällään täysin toimiva. Kun esim. näytölle lisätään uusi kuva, niin ohjelmaan lisätään uuden kuvan käsittely kaikkiin kohtiin joissa sitä tarvitaan. Se onkin tämän ratkaisun suurin ongelma. Jos kuvia lisätään, ennen pitkää ohjelmakoodi on täynnä identtisiä ohjelmarivejä, joissa vain käsiteltävä tietoalkio vaihtuu. Vielä ikävämpää on se, että joskus (useammin kuin haluaisikaan) tämä lisäys unohtuu ja ohjelma ei enää toimi niin kuin pitäisi. Toinen ongelma on se, että käsiteltävien tietoalkioiden määrä on tiedettävä ohjelman kirjoitusvaiheessa.
Monen mielestä luonolliselta tuntuva ratkaisu usean samanlaisen ja lähes samannimisen tietoalkion käsittelyyn olisi käsitellä tietoalkion nimeä kuin merkkijonoa ja korvata nimen lopussa oleva numeroarvo, tietoalkion järjestysnumero, arvolla joka lasketaan ohjelman suorituksen yhteydessä. Näin saadun nimen perusteella haettaisiin sitten kukin tietoalkio ohjelman suoritusvaiheessa erikseen, ja sitä käsiteltäisiin kuten aikaisemminkin. Esim:
for i in 1 upto kuvien_lukumaara
loop
tyhjenna_kuva( kuva + i )
endloop
Tässä kuitenkin sekoitetaan monta asiaa keskenään. Tietoalkioiden nimien
perusteella toki löydetään haluttu tietoalkio, mutta tämän toimenpiteen
tekee kääntäjä tai tulkki _ennen_ tuollaisen suorittamista joten
senkin on tiedettävä etukäteen minkä niminen tietoalkio tällöin on
kyseessä. Yleensä ohjelman suoritusvaiheessa tätä nimeä ei ole enää
oikeastaan olemassa, ja siinä missä ohjelman lähdekoodissa on nimi,
suoritettavassa ohjelmassa se on korvattu tiedolla siitä, mistä vastaava
tietoalkio löytyy. Kääntäjän tai tulkin kannalta nimet kuva1
ja
kuva2
ovat täysin erillisiä nimiä, eikä niillä ole yhtenevästä
alkuosasta huolimatta mitään tekemistä toistensa kanssa. Aluksi tämä
voin tuntua keinotekoiselta rajoitukselta, ja joissakin
ohjelmointikielissä nimien luominen ja niitä vastaavien tietoalkioiden
hakeminen lennossa onnistuukin. Tämä rajoitus muissa kielissä on
kuitenkin perustelua mm. suoritusnopeuden takia, ja koska sen
kiertäminen onnistuu turvallisestikin, sen poistaminen ei ole
mielekästä.
Ratkaisun avaimet ovat taulukot, listat, assosiatiiviset taulukot yms.. Eri ohjelmointikielissä ja kirjastototeutuksissa näillä on omat nimensä, esim. perlissä assosiatiivinen taulukon nimi on hash ja C++:n STL:ssä map. Nämä ovat tietorakenteita joiden avulla useiden (yleensä) samantyyppisten alkoiden käsittely yleensä tehdään. Yksinkertaisuuden vuoksi käsittelen tässä vain yksinkertaisia taulukoita ja listoja.
Taulukot ja listat yleensä tekevät saman kuin edellä esitetty (tosin toimimaton) esimerkki järjestysnumeron laskemisesta, toimintatapa on vain hiukan erilainen. Taulukoissa tietoalkiot ovat jonossa ja kukin niistä saadaan käsiteltäväksi kertomalla mistä taulukosta ja kuinka mones alkio on kyseessä. Esim:
for i in 1 upto kuvien_lukumaara
loop
tyhjenna_kuva( kuvat[i] )
endloop
Tässä esimerkissä "kuvat" on taulukko jossa kaikki käsiteltävät kuvat
ovat jonossa. Kuvat[1]
tarkoittaa ensimmäistä kuvaa tässä taulukossa,
kuvat[2]
toista kuvaa; haluttu numeroarvo voidaan korvata ohjelman
suoritusvaiheessa laskettavalla arvolla ja taulukosta voidaan hakea
kyseinen kuva.
Taulukot tai listat mahdollistavat myös käsiteltävien alkioiden määrän kertomisen ohjelman suoritusaikana. Eri ohjelmointikielissä nämä on toteutettu eri tavoin, esim. C:ssä lähinnä taulukkoa vastaavan tietorakenteen koko on tiedettävä kun se luodaan kun taas C++:n STL:ssä olevaan list:iin voi lisätä alkioita missä vaiheessa tahansa. Hyvin tehdyt jo olemassaolevat toteutukset, jotka käsittelevät taulukoissa olevia tietoalkioita, eivät muutu jos taulukossa olevien alkoiden määrä muuttuu. Tämä säästää paljon aikaa ohjelmaa muutettaessa, on havainnollisempaa kuin useita lähes samanlaisia rivejä peräkäkin ja toimiikin yleensä nopeammin.
Ohjelmointikielet käyttävät reaalilukujen esittämiseen yleensä liukulukuja. Liukuluvilla ei voida esittää reaalilukuja tarkasti, mistä usein seuraa yllättäviä ongelmia. Esimerkiksi liukuluvilla laskettaessa monet normaalit laskusäännöt eivät välttämättä päde, koska esitettävän luvun tarkkuus riippuu suuruusluokasta. Jori Mäntysalo on tehnyt sivun, jolla kerrotaan tarkemmin mikä on liukuluku. Hänon myös tehnyt sivun "Tietokone laskee väärin", jossa esitetään muutama esimerkki asiasta.
Tiedostojen käsittely on periaatteessa käyttöjärjestelmäriippuvaista. Koska kaikki nykyiset yleiset käyttöjärjestelmät käsittelevät tiedostoja suunnilleen samalla tavalla, eräät perusasiat pätevät kaikkialla.
Yleensä tiedostoa käsitellään yhtenäisenä jonona tavuja., johon ei voi lisätä keskelle mitään tai poistaa mitään keskeltä. Kirjoitusoperaatiot kirjoittavat tiedostossa olevan datan päälle. Tiedoston kokoa voi yleensä muuttaa kirjoittamalla tiedoston loppuun tai katkaisemalla tiedosto tietyn kokoiseksi.
Niinpä yksinkertaisin algoritmi rivien poistamiseksi on seuraava:
-
Avaa haluttu tiedosto lukua varten.
-
Luo väliaikaistiedosto kirjoittamista varten.
-
Lue tiedostosta rivi
-
Jos se ei ole poistettava rivi, kirjoita se väliaikaistiedostoon.
-
Toista kohtia 3. ja 4. kunnes alkuperäinen tiedosto on luettu kokonaan.
-
Sulje molemmat tiedostot.
-
Poista alkuperäinen tiedosto ja nimeä väliaikaistiedosto alkuperäiseksi.
Vastaavasti tiedostoon lisätään rivejä keskelle tai alkuun seuraavalla tavalla:
-
Avaa haluttu tiedosto lukua varten.
-
Luo väliaikaistiedosto kirjoittamista varten.
-
Lue tiedostosta rivi
-
kirjoita se väliaikaistiedostoon.
-
Toista kohtia 3. ja 4. kunnes ollaan kohdassa, johon haluat uuden rivin lisätä.
-
Lisää uusi rivi (tai uudet rivit).
-
Kirjoita loput alkuperäisestä tiedostosta uuteen tiedostoon samalla tavalla kuin kohdissa 3-5.
-
Sulje molemmat tiedostot.
-
Poista alkuperäinen tiedosto ja nimeä väliaikaistiedosto alkuperäiseksi.
Tiedoston alkuun lisätään rivejä hyppäämällä kohtien 3-5 yli ja jatkamalla kohdasta 6 eteenpäin.
Seuraavassa kuvataan, miten C-kääntäjä tuottaa lähdekoodista ohjelmatiedoston. Vaikka nykyiaikaiset kehitysympäristöt usein piilottavat käännöksen välivaiheet, toimintaperiaate on useimmissa ympäristöissä sama. Tämän toiminnan tunteminen saattaa usein auttaa ongelmien selvittämisessä.
Myös C++-ohjelmat käännetään samalla tavalla.
C-lähdekoodin kääntäminen koostuu itseasiassa kolmesta vaiheesta:
-
Esikääntäjä käsittelee lähdekooditiedoston ennen sen kääntämistä. Se sisällyttää lähdekoodiin
#include
-direktiivillä määritellyt tiedostot, korvaa#define
-makrot niiden arvoilla ja käsittelee ehdolliset#ifdef
-osiot. Se myös usein poistaa kommentit. -
Kääntäjä lukee esikääntäjän käsittelemän lähdekooditiedoston ja kääntää sen. Se luo joko luo suoraan binäärikoodisen objektitiedoston tai symbolisen konekoodin, josta tehdään objektitiedosto assemblerin avulla. Jokaisesta lähdekooditiedostosta tehdään oma objektitiedosto.
-
Linkkeri kokoaa kääntäjän luomista objektitiedostoista ja kirjastotiedostoista ajokelpoisen ohjelman.
Muutamaan asiaan kannattaa kiinnittää huomiota. Esikääntäjä ei ymmärrä
C:n syntaksia. Sille ohjelmakoodi on pelkkää tekstiä. Rivi #include "jotain.h"
vastaa täysin sitä, että sijoittaisit tuon rivin tilalle
tiedoston "jotain.h" sisällön ja #define
-määrittelyt vain korvaavat
merkkijonoja toisilla.
Kääntäjä käsittelee kerrallaan vain yhtä tiedostoa. Vasta linkkeri
kokoaa eri ohjelmatiedostoissa olevan koodin yhdeksi ohjelmaksi.
Kääntäjä ei myöskään käsittele #include
-tiedostoista sisällytettyä
koodia mitenkään erikoisella tavalla.
Linkkeri käsittelee konekoodia sisältäviä objektitiedostoja
. Se ei
tiedä millä ohjelmointikielellä kyseinen ohjelmakoodi on kirjoitettu.
Kuten edellisestä kävi selville #include
ei ole ohje C-kääntäjälle
liittää ohjelmaan tietty kirjasto, vaan ohje esikääntäjälle
sisällyttää kyseisen tiedoston sisältö kyseiseen kohtaan ohjelmakoodia.
Tämä tiedosto (ns. header-tiedosto) yleensä sisältää kirjastoa
käyttävien ohjelmien kääntämiseen tarvittavat määrittelyt. Sinun on
vielä kerrottava linkkerille
että haluat kyseisen kirjaston mukaan.
Itseasiassa GCC:ssä on kaksi eri ominaisuutta helpottamassa ohjelmointia. Ensimmäinen on se, että se tunnistaa lähdekooditiedoston päätteestä sen tyypin ja käyttää oikeaa kääntäjää. Tämä ei kuitenkaan vaikuta ohjelmien linkittämiseen mitenkään.
Toinen ominaisuus on se, että kun linkkeriä kutsutaan g++
-komennon
avulla, GCC automaattisesti linkittää mukaan C++-ohjelman tarvitsemat
ajonaikaiset kirjastot. Käännä siis C++-ohjelmat käyttäen
g++
-komentoa.
Haluan kommentteja, risuja, kritiikkiä sekä ehdotuksia. Avuliaat palkitaan ikuisella kunnialla - sillä, että saa nimensä alla olevaan luetteloon. Niin, ja avulias saa itselleen hyvän mielen, mikä tärkeintä!
Haluan kiittää kaikkia, jotka ovat auttaneet minua tämän kirjoitelman kokoamisessa. Erityisesti haluan kiittää seuraavia ihmisiä, jotka mainitsen aakkosjärjestyksessä:
-
Heikki Kantola
-
Paul Keinänen
-
Jukka Korpela
-
Jouko Koski
-
Vesa Lappalainen
-
Jani Miettinen
-
Kalle Olavi Niemitalo
-
Mika Rantanen
-
Jukka Suomela
-
Kimmo Surakka
-
Antti Valmari
Mikäli mielestäsi sinun pitäisi olla mainittu tuossa listassa, olet luultavasti oikeassa; pistä minulle meiliä, olen todennäköisesti vain ollut hieman hajamielinen.
FAQ:n ylläpitäjä tarvitsee avustajia. Jos kiinnostaa, ota yhteyttä meilillä ([email protected]).