Tällä sivulla esitetään kritiikkiä UTF-8:n käytöstä IRC:ssä sekä puolesta että vastaan. Kun teet muokkauksen, pidä teksti asiallisena. Sivu voidaan lukita, jos havaitaan toistuvaa aggressioiden purkamista töhrimisten muodossa.

Miksi UTF-8:aa tulisi käyttää IRC:ssä? (puolestapuhujat)

Usein kysytään, mihin UTF-8:aa IRC:ssä edes tarvitaan. Onhan tähän astikin pärjätty vallan hyvin 8-bittisillä merkistöillä 1), eikö? 8-bittisistä merkistöistä löytyy aivan riittävästi merkkejä tavalliseen keskusteluun, eikö niin? Tämä on täysin totta, mutta UTF-8:n tarkoitus ei olekaan ratkaista mitään olematonta ongelmaa siitä, etteikö 8-bittisissä merkistöissä olisi kaikkia tarpeellisia merkkejä suomalaisille.

Maailmassa on käytössä kymmenittäin erilaisia merkistöjä, jotka ovat keskenään yhteensopivia yleensä vain ensimmäisen 127 merkin suhteen (alkuperäinen 7-bittinen ASCII). Mikäli suomalainen käyttäjä haluaa kirjoittaa jotakin muuta kieltä kuin suomea eikä kielen merkkejä löydy hänen juuri tällä hetkellä käyttämästään merkistöstä, joutuu hän etsimään oikean merkistön. Esimerkiksi puolan, venäjän, arabian, thain, kiinan, japanin, heprean ja monen muun kielen kirjoittaminen ei yksinkertaisesti ole mahdollista vain yhdellä 8-bittisellä merkistöllä – varsinkaan näiden kielten sekakäyttö. Vaikka tämä vaikuttaa kuvitteelliselta ongelmalta eli ns. metaongelmalta 2), tosiasia on, että merkistöjen kanssa on pakko räpeltää silloin tällöin. Lähin selkein tapaus löytyy heti Venäjältä - kyrillisiä kirjaimia ei voi esittää Latin1:llä. Myös siellä on sama ongelma: yleisesti käytetty KOI-8-merkistö ei tue muita kieliä pahemmin.

Ongelmaa lisää se, että useimmat IRC-asiakasohjelmat tukevat vain yhtä merkistöä kerrallaan. Merkistöä ei useinkaan voi valita kanavakohtaisesti, vaan yksi asetus on käytössä koko ohjelmassa. Eri merkistöt eivät olisi ongelma, jos IRC-protokollassa voisi määritellä, millä koodauksella viestit lähetetään, kuten WWW-sivuissa, nyysseissä ja sähköpostissa voidaan MIME-tyypillä tehdä. Tyyppitieto kuitenkin puuttuu.

Tämä on ensimmäinen ongelma, jonka UTF-8 ratkaisee. Sen sijaan, että jouduttaisiin vaihtamaan keskenään yhteensopimattomien merkistöjen kesken aina tarpeen tullen, voidaan käyttää yhtä ainoaa merkistöä kaikkiin kieliin, eikä tule koskaan tarvetta miettiä, mitä merkistöä kuuluisi käyttää tai miten siihen vaihdetaan. UTF-8:n käytöllä kierretään kokonaan ongelma siitä, etteivät IRC-viestit sisällä tietoa niiden koodauksesta.

Vastaavasti esim. IRC-botit ja skriptit voivat toki vastata kanaville kanavaspesifisellä merkistöllä (jos se on konfiguroitu), mutta mitä merkistöä käytetään yksittäisen käyttäjien vastauksiin (esim. CTCP:llä)? Jokainen pyytää erikseen haluamansa merkistön?

Eri merkistöjen ristikäyttö, ja keskustelukumppanin käyttämän merkistön arvaaminen lisää konversiovirheitä. Esimerkiksi tyypillisesti UTF-8:aa tukevat asiakasohjelmat olettavat epävalidin UTF-8:n olevan Latin1:tä, mutta se voi yhtä hyvin olla jotain muuta merkistöä.

Unicoden ja latin-merkistöjen välinen taistelu on jo paisuttanut Internetin täyteen kaikenlaista keskustelua. Olisi paljon helpompaa, jos kaikki vain käyttäisivät samaa merkistöä, jolloin kaikki kinastelu loppuisi. Vai haluaako joku edelleenkin jatkaa tätä turhaa tappelua?

Optimaalinen tilanne siis on että kaikilla on käytössä UTF-8, jolloin mitään merkistömuunnoksia ei tarvita. UTF-8-tuki löytyy jo nykyaikaisista käyttöjärjestelmistä, vain joitakin ohjelmia ei ole päivitetty. UTF-8:n jälkeen ei ole tarvetta uusille muutoksille, koska kaikki kielet voidaan esittää sillä.

Kritiikkiä vastustajien yleisimpiin väitteisiin

"Suurin osa asiakasohjelmista ei ymmärrä UTF-8:aa, joten sen ottaminen käyttöön rikkoo kaikilta muilta mm. merkit ä ja ö"

Useista ohjelmista uusin versio itse asiassa todennäköisesti ymmärtää UTF-8:aa, tai ehkä ohjelman kehitys on loppunut. Toki kaikki käyttäjät eivät vielä ole päivittäneet asiakasohjelmiaan, mutta kyse on vain siirtymäkauden ongelmista. Samalla perusteella ei voitaisi ottaa mitään uusia ominaisuuksia minnekään käyttöön, mikäli ne aiheuttavat mitään häiriöitä muinaisiin järjestelmiin.

"Koska tuo ei ole vielä pitkään aikaan käytännössä mahdollista, ei UTF-8:n yleisessä käytössä ole mitään optimaalista. Merkistön vaihtaminen on ennenaikaista"

Nämä perustelut UTF-8:aa vastaan perustuvat ainoastaan status quon (nykyisen tilanteen) säilyttämiseen. UTF-8:sta näyttää tulevan hallitseva (tai jopa ainoa) koodaus yleisesti - miksei siis myös IRC:ssä? Kaikkiin nykyaikaisiin käyttöjärjestelmiin saa UTF-8-tuen jo nyt, joko asentamalla uuden IRC-asiakasohjelman, tai lisäämällä sopivan skriptin. Vastustus perustuu siihen, että ei haluta tehdään mitään muutoksia.

"Kuitenkin lähes kaikki keskustelu tapahtuu suomeksi tai englanniksi"

Ehkäpä monilla suomalaisilla. Monet englantia puhuvat ovat jo ottaneet käyttöön UTF-8:n, sillä se ei heille aiheuta edes siirtymäkauden haittoja. Sen lisäksi suomen kielen erikoisvyöhyke aiheuttaa muille vain ongelmia, kun yleisesmaailmallisesti on jo pitkään käytetty tai siirrytään kohti UTF-8:aa. Tuntuu oudolta, kun useimmat englannin kieliset käyttäjät ymmärtävät sujuvasti Unicoden sisältämiä erikoismerkkejä, mutta suomalaisilla kanavilla siitä tulee monoa. Toki vaihdos on ollut jenkeille helpompi, kun he harvoin tarvitsevat ä:tä ja ö:tä, ja muut merkit toimivat suoraan samoilta paikoilta kuin ASCII:ssakin.

"Paljon helpompi niiden harvojen, jotka niitä erikoismerkkejä tarvitsevat on päivittää clienttinsä"

Ja ollaan siis edelleen välitilassa, jossa pitää valita merkistö vastapuolen mukaan, ja kaikkien pitää tehdä säätöjä koko ajan. Käyttämällä nykyaikaista asiakasohjelmaa ja UTF-8:a, ei kenenkään tarvitsi miettiä merkistöjä.

Miksi UTF-8:aa ei tulisi käyttää IRC:ssä? (vastustajat)

UTF-8 vs. Latin1 suomalaisilla IRC-kanavilla

Suomalaisilla IRC-kanavilla on vuosia käytetty lähinnä kolmea tai neljää merkistöä: ISO-8859-1 (latin1), ISO-8859-15 (latin9), Windows-1252 (CP-1252) sekä hieman UTF-8:aa. Näistä merkistöistä CP-1252 lienee suosituin ja käytössä lähes jokaisessa Windows-koneessa. Linuxissa ja muissa käyttöjärjestelmissä ovat varsin yleisesti käytössä sekä latin1 että latin9.

Yllämainituista merkistöistä keskenään suurin piirtein yhteensopivia ovat kolme ensimmäistä, jotka eroavat toisistaan vain harvinaisten merkkien, kuten EUR osalta. UTF-8 on ASCII-merkkien osalta yhteensopiva, mutta ei suomen kielen kannalta olennaisten skandien.

UTF-8

  • Hyvää
    • Merkit toimivat hyvin, jos kaikkien client-ohjelmistot sekä terminaalit tukevat UTF-8:a.
    • Erinomainen koodaustapa käytettäväksi monikielisillä kanavilla.
    • Tappelu euro-merkin käytöstä voidaan vihdoin lopettaa ja saadaan sen lisäksi käyttöön vielä useita muita merkkejä, kuten m-viiva.
  • Huonoa
    • Suomessa yleiset skandit (öäå) näkyvät ei-UTF-8 käyttäjille väärin (olettaen, että recode-toimintoa ei käytetä).
    • Osittainen siirtyminen aiheuttaa sotkua suomalaisilla kanavilla. Ohjelmilta vaaditaan käytännössä recode fallback-tuki latin1-yhteensopivaan merkistöön, jotta vaihdos olisi joustava. Tavallisimmista clienteistä fallback-tuki löytyy.

Latin1

  • Hyvää
    • Skandit toimivat tällä hetkellä lähes kaikilla suomalaisilla irkkaajilla, myös heillä, jotka käyttävät irssi 0.8.10:iä UTF-8:lla.
    • Lähes täysin yhteensopiva monien muiden suomalaisilla kanavilla käytössä olevien merkistöjen kanssa (CP-1252 ja latin9).
    • Kehittyneet clientit, kuten irssi 0.8.10, sisältävät mahdollisuuden käyttää UTF-8 merkistöä monikielisilllä kanavilla, joissa sen käyttö on perusteltua, sekä mahdollisuuden käyttää latin1:stä suomalaisilla kanavilla, joissa skandien toimiminen kaikilla käyttäjillä on tärkeintä.
    • Suomessa yleiset skandit (öäå) näkyvät lähes kaikille suomalaisille UTF-8-käyttäjille oikein, koska kehittyneet IRC-clientit (kuten irssi 0.8.10, jmIrc 0.95, X-Chat ja mIRC 6.17) kykenevät tunnistamaan UTF-8 merkkijonot ja tällöin tulkitsemaan merkkijonot latin1:nä.
  • Huonoa
    • Muutamat suomen kielessä harvinaiset merkit eivät toimi oikein. Tälläisiä ovat mm. suhu-s ja euro-merkki. Euro-merkki löytyy Latin-9:stä ja CP-1252:sta, mutta eri kohdista (näkyy siis väärin). Latin-1 ei tue euro-merkkiä.
    • Ei-länsieurooppalaisten kielten merkit eivät toimi ollenkaan.
    • Typografiset merkit puuttuvat kokonaan.
    • Kaikki modernit käyttöjärjestelmät tulevat Unicode-pohjaisina, joten uudet IRC-käyttäjät joutuvat säätämään asiakasohjelmiaan saattaakseen ne latin-yhteensopiviksi. Tämä voi tuntua turhauttavalta, koska se voi olla ainoa paikka, jossa muuta merkistöä tarvitaan.

Yhteenvetona, UTF-8:lla on oma paikkansa erikoismerkkien ystävien keskinäisessä käytössä, mutta yleisessä käytössä se aiheuttaa toistaiseksi enemmän uusia ongelmia kuin ratkaisee vanhoja, josta syystä sen yleinen käyttö ei ole suositeltavaa.

Kritiikkiä puolustajien yleisimpiin väitteisiin

"Optimaalinen tilanne siis on että kaikilla on käytössä UTF-8"

Koska tuo ei ole vielä pitkään aikaan käytännössä mahdollista, ei UTF-8:n yleisessä käytössä ole mitään optimaalista. Merkistön vaihtaminen on ennenaikaista.

"Esimerkiksi puolan, venäjän, arabian, thain, kiinan, japanin, heprean ja monen muun kielen kirjoittaminen ei yksinkertaisesti ole mahdollista vain yhdellä 8-bittisellä merkistöllä - varsinkaan näiden kielten sekakäyttö."

Ei varmasti. Siksi UTF-8 onkin heille erinomainen vaihtoehto. Tässä vain unohdetaan se, että harvempi suomalaisista irkkaajista kokee tarvetta kirjoittaa noita kieliä juuri irkissä. Kuitenkin lähes kaikki keskustelu tapahtuu suomeksi tai englanniksi. Lisäksi puolalaisilla, venäläisillä, araveilla, thaimaalaisilla, kiinalaisilla, japanilaisilla ja heprealaisilla on käytössä omat vakiintuneet merkistökoodaukset, jotka vielä yleensä toimivat yhteen ASCIIn kanssa samalla tavalla kuin UTF-8. Miksi korjata jotain, mikä ei tarvitse korjausta.

"Vaikka tämä vaikuttaa kuvitteelliselta ongelmalta eli ns. metaongelmalta 2), tosiasia on, että merkistöjen kanssa on pakko räpeltää silloin tällöin."

Ei niiden kanssa tarvitse räpeltää, kunhan käyttää UTF-8:ia ja laittaa recoden pistämään latin1-yhteensopivaa suomalaisille kanaville ja sitä UTF-8:ia niille kanaville, joilla sille on oikeasti tarvetta. Niitä kanavia kun on kuitenkin vain erittäin vähän suomalaisilla irkkaajilla, joten paljon helpompi niiden harvojen, jotka niitä erikoismerkkejä tarvitsevat on päivittää clienttinsä, kuin kaikkien suomalaisten irkkaajien, jotka eivät tarvitse UTF-8:n tuomia lisämerkkejä.

"Yleismaailmallisesti on jo pitkään käytetty tai siirrytään kohti UTF-8:aa"

Keksitty väite; UTF-8:n käyttö irkissä on sinänsä jo uusi idea eikä edes marginaaliryhmä ole sitä “pitkään käyttänyt”. Lisäksi yleismaailmallisesti ei olla siirtymässä mitenkään erityisesti UTF-8:a kohti sen enempää kuin Suomessakaan. Erityisesti siirtymistä ei tehdä niissä maissa, joissa tarvitaan ASCIIn lisäksi muitakin merkkejä, koska siellä siirtyminen rikkoo nyt täysin toimivan järjestelmän.

Kommentteja

  • “Suomenkielisillä IRC-kanavilla käytyjen keskustelujen perusteella…”: Tässä olisi varmaan hyvä mainita lähde, millä kanavilla tälläisiä keskusteluja on käyty?
    • Miksi pitäisi rikkoa skandit suurelta osalta irkin käyttäjistä sen takia, että Jukka Tukaani Kukkonen voisi käyttää jotakin kahta erikoismerkkiä yhtä aikaa?
    • UTF-8-keskustelua on ollut ainakin IRCnetin kanavilla #masinointi, !bittivuoto, #tukaani, #slackware.fi, #openbsd.fi, #debian.fi, #macintosh.fi ja #muropaketti. Vastustavia mielipiteitä on muutamia näkynyt, mutta suuri osa vastustajistakin on myöntynyt, kun heille on neuvottu, miten merkit saa toimimaan oikein kaikkialla (esim. tarjottu tuore paketti irssistä ohjeineen). Vastustajien perustelut ovat yleensä olleet “nykyinen toimii, ei jaksa vaihtaa”. #debian.fi on poikkeus, siellä vastustamisen perusteena on käytetty myös sitä, ettei tuoretta irssiä löydy kyseisen distron vakaasta jakeluversiosta. Toisen poikkeuksen tekee #muropaketti, siellä vastustus on perustunut mm. blazen valmiin standalone cygwin-irssin käyttökelvottomuuteen merkistömuunnoksissa, sillä ks. paketista puuttuu perl-tuki. Myöskään paketin mukana tuleva rxvt ei tietojeni mukaan tue utf-8:ia.
  • Ei oikeastaan kiinnosta tahi liikauta _yhtään_, mitä joku ”#tukaani”-nevöhöödtsätti on “päättänyt”. Sori vain.
    • Hajoo sit siihen
  • “Suurella porukalla päätetty siirtyä”: Vakuuttaisi varmaan kaikkia enemmän, jos tästä “suuresta porukasta” olisi jotain muutakin ideaa kuin #tukaani.
    • Niin no, tämmöisiä nämä Linux-hihhulit ovat. Tarkastellaan maailmaa mehupillin läpi. Linux on elämä, irssi on elämä, kaikkien Windowsia ja mIRC:iä käyttävien pitäisi VÄLITTÖMÄSTI “päivittää” hyvin toimivat järjestelmänsä tähän kaikkien käyttöjärjestelmien jumalaan tai ainakin luopua mIRC:n käytöstä! Avarakatseistako? Suosittelen käyttämään kickban-toimintoa vapaasti heti UTF-8 mongerrusta tavattaessa, kanavalla kuin kanavalla.
      • Opettele lukemaan. Tällä sivulla ei ole niinkään kyse Linuxista tai irssistä vaan UTF-8:an käyttöönotosta irkissä. Niitä UTF-8:aa tukevia IRC-klienttejä on Windowsillekin vaikka kuinka ja toisaalta irssi on saatavilla myös Windowsille. Ei todellakaan ole tarvetta siirtyä Linuxiin pelkän UTF-8:an takia. Ja jos suppeampi UTF-8-toiminnallisuus riittää, ei ole tarvis edes siirtyä pois mIRC:istä vaan tarvitaan jokin mIRC-skripti.
        • On se niin helppoa. Tästä tämmöinen hieno skripti joka toimii miten toimii ja rikkoo siinä samalla yhteensopivuuden, mutta tärkeintähän on että UTF-8 vääräoppiset saavat haluamansa. Get a clue: EN halua vaihtaa clienttiä, EN halua alkaa käyttämään lisäskriptejä, EN halua mitään _marginaalisia_ hyötyjä mitä UTF-8 mahdollisesti teoriassa mahdollistaisi (siitä on loppupeleissä enemmän haittaa kuin hyötyä), EI KIINNOSTA!!! Ei kiinnosta oikeastaan kuin se että te UTF-8 aivopestyt ihmiset yksinkertaisesti lakkaatte olemasta tai häviätte vaikka mustaan aukkoon.
          • Miksi “ET”? Perustele! Nyt tuo sinun meuhakaamisesi vaikutta lähinnä tältä: “Se vaan on näin! EN halua! Piste!”. Sitäpaitsi, jos nimenomaan teikäläinen ei halua saada osakseen UTF-8:an suomia hyötyjä, niin tarkoittaako se sitä, ettei kukaan muukaan missään tapauksessa saa päästä osalliseksi UTF-8:an suomista hyödyitä, jotka henkilöstä riippuen voivat olla marginaalisia tai suuria? Tosin tuosta meuhkaamisestasi ilmitulevasta EVVK-asenteesta päätelleen teikäläistä ei taida kiinnostaa edes se, mitä hyötyjä UTF-8:sta olisi muille. Eli et osaa kuin tuijotella omaan napaasi.
            • Eikö se ole selvää? Miksi vaihtaisin clienttiäni, kun mIRC toimii ihan hyvin? Miksi rikkoisin yhteensopivuuden jollain puolivalmiilla UTF-8 skriptiviritelmällä? Aiheesta koituva haitta ja vaiva ei ole suhteessa saavutettuun hyötyyn. Ei tässä nyt olla mitään hepreaa kirjoittelemassa. Aivan varmasti useimmat suomalaiset käyttävät pelkästään a-Ö, 0-9 + tavallisimpia erikoismerkkejä (piste, pilkku, huutomerkki, kysymysmerkki jne) kahdella, mahdollisesti kolmella, kielellä: suomi, englanti ja ruotsi. Sopii alkaa työstämään ilmaisukykyään jos ei näillä pärjää. Varmasti lowercase perusaakkoset plus numeraalit olisivat nekin riittävät. Mietipä tätä: tähän päivään mennessä ISO-8859-1 koodattuja skandeja tuetaan jo varsin mukavasti. No, UTF-8 pitää huolen siitä ettei maailmanlaajuisesti puhuttuna ole taas mitään mahiksia nähdä näitä erikoismerkkejämme oikein pitkään pitkään aikaan. Ette tosissanne voi luulla että koko maailma lähtisi mukaan tähän hapatukseen! Vaikka koko Suomi höynäytettäisiin UTF-8 käyttäjiksi, se jättää edelleen aika monta miljoonaa irkkaajaa joita ei voi vähempää kiinnostaa hankkia UTF-8 yhteensopivuutta tai tulkkauskykyä. Ihmettelen mitä seuraavaksi. mIRC-värejä, XML-tageja, embedded mime64-koodattua multimediacontenttia? :O
              • Ensin sanot, että kaikki puhuvat kuitenkin englantia, ja sitten väität, että englanniksi puhuvia kiinnostaisi skandit… No, huvinsa kullakin.
                • Kuka tässä on väittänyt että “kaikki puhuvat kuitenkin englantia”? Et varmaankaan ajatellut koko juttua? Tässä on nyt kyse siitä että on meidän intresseissämme jotta suomalaiset nimet, paikannimet, osoitteet yms. näkyisivät oikein ulkomaalaisille – kyllä, sille suurelle enemmistölle jolla ei ole UTF-8 tukea IRC-clientissään, eikä tule. Ehdotan että hautaamme koko tämän UTF-8 idean ja harkitsemme asiaa uudelleen vuonna esimerkiksi vuonna 2016.
                  • Ei ole eikä tule? Mielestäni surkuhupaisaa, että monet englantia puhuvat amerikkalaiset irkkikaverini näkevät ASCII:n ulkopuoliset UTF-8-merkkini oikein, mutta suomalaisille ne tuottavat vaikeuksia. http://irc.mozilla.org/ on hyvä esimerkki suomalaisten luonteesta: Vain suomalaisille ja japanilaisille ei ole UTF-8 kelvannut Mozilla-projektin kanavilla käytettäväksi. Ruotsalaiset, norjalaiset ja tanskalaiset “pärjäävät” UTF-8:lla.
                    • Japanilaisille? Heh, olenkin useasti veikkaillut että siellä päin maailmaa tasan ketään ei kiinnosta irkissä vaihtaa nykyisestä enkoodaustavasta (Japanilaisten irkkaajien keskuudessa ainakin IRCnetissä ISO-2022-JP) UTF-8:aan koska se rikkoo käytännössä KAIKKI merkit toisin kuin täällä päin maailmaa jossa se rikkoo vähemmän mutta silti aivan liikaa asioita. Ilmeisesti olin oikeassa joten se siitä UTF-8 -mouhottajien uljaasta utopiasta IRC:ssä jossa kaikki käyttäisivät samaa merkistöä. Jenkkisentrinen paskasysteemi joka on olevinaan mukamas hirveän nerokas sanon minä.
  • Edelleen “Sitten kaikki näkevät mun merkit ihan väärin!” on väärässä kohdassa “yleisissä väärinkäsityksissä”. Tuo ei ole väärinkäsitys, mikäli kehotetaan siirtymään UTF-8-merkistöön, vaan täyttä totta. (Toki niissä rajoissa, että kaikki-sana voidaan tulkita puhekielen merkityksessä “98 prosenttia”.) Toki ko. kohdassa on ihan korrekti lisähuomautus, että UTF-8:n käyttöön ei ole tarkoitus siirtyä, jos ei halua noita yhteensopivuusongelmia, vaan tällöin voi asentaa pelkän lukutuen. Mutta mitä koko tuo tekstinpätkä sitten tekee tällä sivulla!?
    • Aiheesta voi tulla keskustelemaan IRCNetin kanavalle #UTF-8.
      • “aiheesta voiblabla….” Minusta tuo ei nyt kauhean hyvä selitys ole ja niin kauan kun tämä yhteensopivuusongelma on olemassa, en aio UTF-8:aan siirtyä. Outoa etteivät ihmiset ota tähän puoleen paljoa huomiota, muutenhan varmaan kaikki siirtyisivät UTF8-käyttäjiksi. En todellakaan ala jakamaan käskyjä “Siirtykää UTF-8:aan, jotta voin käyttää kahta erikoismerkkiä”. Vinkki: Murtoluvut voi kirjoittaa jakolaskuina, copyright-merkin ( C ) ja trademarkin ( R ).
        • Yhteensopivuusongelma ei katoa mihinkään ennen kuin kaikki käyttävät yhtä ja samaa merkistöä. Muu maailma ei ole menossa takaisin Latin1:en, tai ole koskaan sitä käyttänytkään. Nopea siirtyminen vähentää siirtymäajan tuskaa.
          • Mikä ihmeen yhteensopivuusongelma? Mitään yhteensopivuusongelmaa ei ollut, ennen kuin sinunlaisesi sen tahallisesti loivat. Ja ei kukaan ole ehdottanut muun maailman siirtymistä Latin1:een, naurettava olkinukke. Kuinkahan paljon mahdat edes ymmärtää merkistöistä, kun ilmeisesti luulet, että kaikkialla maailmassa on joskus käytetty Latin1:ä, kun kerran sanoit “takaisin”?
  • Tämä sivu muuten edustaa sitten juuri sitä tyypillistä Unicoden tulevaa käyttöä: erikoismerkeillä väärin brassailu. Olisitte vain kirjoittaneet shift + 2 -lainausmerkit, koska nyt käytette (ja korvaatte kaikista kommenteista) aivan väärin noita oikeita lainausmerkkejä. Kotitehtäväksi jää selvittää, mitä lainausmerkkejä suomessa käytetään lainauksen alussa ja lopussa.
    • Ehei, vaan muutoksen tekee tuo “tyhmä” wikiohjelmisto.
    • Huomatkaa silti, että vain UTF-8 mahdollistaa erikoismerkkien oikean käytön.
      • Huomataan. Huomaamme myös sen, että usea UTF-8:n puolesta erikoismerkkien takia vouhottava ei kirjoita IRC:ssä läheskään täydellistä kirjakieltä muutenkaan. Ei siis “vääränlaisten” lainausmerkkien tahi muutamaa pikseliä liian lyhyeksi jäävän viivan luulisi olevan mikään hirveä ongelma. Kannattaa myös huomata että recode-systeemit eivät ole mikään ratkaisu niin kauan kuin ei pysytä vain Latin1:stä löytyvissä merkeissä (jossa tapauksessa järki UTF-8:n käytössä on iso pyöreä 0) koska loput näkyvät kuitenkin liian usein kysymysmerkkeinä tai vastaavana roskana. Lisäksi Windowsissa (ja muuallakin) “oikeankaan” UTF-8 -tuen kanssa ei välttämättä läheskään kaikilla irkkaajilla näy kaikki merkit oikein. PuTTY rikkoi Windowsin fontlinkingin versiossa 0.58 (0.57 on jostain vuodelta 2004) eikä se niissä vanhoissakaan toimi täydellisesti. On tosin olemassa muunneltu PuTTY (nimeltään PieTTY) jossa fontlinking toimii täydellisesti ainakin omassa Windows 2003 -järjestelmässäni, mutta se on sitten muuten buginen ja kurja. Uusimmalla mIRC:llä fontlinking toimii täydellisesti omalla koneellani testattuna, mutta ei toiminut WinME:llä ja Win98SE:llä testattuna (niitäkin on ihan oikeasti vielä käytössä ja paljon). Uusimmassa X-Chatissa (jonka viralliset Windows-binäärit muuten ovat shareware-kakkaa myös nykyään) toimi myös fontlinking täydellisesti omalla koneellani testattuna. Veikkaan kuitenkin että se ei toimi yhtään sen paremmin 9x-pohjaisissa Windowseissa kuin mIRCin vastaava.
  • Niin pitkään kuin mIRC ei tue UTF-8:aa natiivina, tämä kaikki on turhaa. Maailmaa voi tietysti yrittää muuttaa, muttei pidä pettyä jos/kun epäonnistuu surkeasti. Hlökohtaisesti tulen vastustamaan tätä siirtymistä jokaisella kanavalla missä minulla on valtaa vaikuttaa asiaan.
    • mIRC on vain yksi ohjelma, monet käyttävät nykyään X-Chatia windowsissa.
      • Eikai se ohjelmien määrä ole merkityksellinen vaan käyttäjäprosentit, pitäisi saada mIRC jossa olisi UTF-8 oletusmerkistönä.
    • Muutenkin Windowsissa on kattavasti Unicodea, eipä anneta yhden irc-ohjelman hidastaa kehitystä.
      • Sopii pitää mielessä että mIRC on de-facto standardi, se ei ole vain “yksi irc-ohjelma”.
        • Saisiko noista oikeasti jotain tilastotietoja? Quakenetin sivuilla on joku kaksi vuotta vanha tilasto, jossa mIRC on ylivoimaisesti käytetyin ohjelma, mutta verkkoja on muitakin (mm. IRCnet, Efnet, DALnet, Freenode, Enterthegame, …). Muuten tässä ollaan juupas-eipäs-linjalla.
          • Hoh hoijaa. Seuraavaksi varmaankin tahdot tilastotietoja siitä, miten Windows on yleisin käyttöjärjestelmä maailmassa, et voi hyväksyä tosiasiaa että se yksinkertaisesti on. Kyllä, Windows on yleisin käyttöjärjestelmä maailmassa. Kyllä, mIRC on yleisin IRC-clientti maailmassa perustuen edelliseen pointtiin – graafisia IRC-clienttejä Windowsille on muitakin mutta mIRC on tunnetuin ja yleisin. Jos haluat tilastotietoja, joudut avaamaan silmäsi ja tarkastelemaan rupelihattulähipiirisi ulkopuoleista maailmaa. Tämä selvä?
            • En oikein näe, miten tämä edistää keskustelua mihinkään suuntaan. Toki tiedän, että Windows on paljon käytetty käyttöjärjestelmä, koska olen lukenut tilastoja aiheesta. En tiedä, onko mIRC yleisin IRC-asiakas, koska en ole nähnyt ainuttakaan tilastoa aiheesta (Quakenetin vanhentunutta tilastoa lukuunottamatta; myönsinhän jo tuossa aiemmassa kommentissa, että mIRC oli vuonna 2004 käytetyin ohjelma Quakenetissä). Ja minähän nimeonomaan sanoin haluavani tilastotietoja aiheesta! En kysynyt, voisiko joku väärentää tilastot niin, että niistä kävisi ilmi jotain muuta. Kyseenalaistin paljon käytetyn väitteen mIRCin yleisyydestä aidon faktatiedon puuttuessa. En ole itse esimerkiksi koskaan käyttänyt mIRCiä, joten minulle se on vain yksi ohjelma muiden joukossa. Minusta on äärimmäisen naiivia uskoa suoralta kädeltä kaikki, mitä minulle sanotaan. Olen yliopistossa oppinut kyseenalaistamaan epäilyttäviä väitteitä, ja mIRCin yleisyysväite on epäilyttävä, kunnes joku näyttää tilastot minulle.
              • Niin ja yliopistossa vissiinkin opettivat myös ummistamaan silmänsä todellisuudelta. Selvä tapaus. Ei lisäkommentoitavaa.
                • Sen sijaan, että jatkaisit parjaamistasi (“Minä, minä olen oikeassa, koska sanon niin!”), voisit kaivaa jostain niitä tilastoja. Muuten tämä on aivan mutu-perusteella keskustelua eikä johda mihinkään. Aivan yhtä hyvin minä voin väittää, että mIRCiä käyttää 49% irkkaajista, koska siltä minusta oikeasti tuntuu. En kuitenkaan väitä niin, koska en ole löytänyt kattavaa tilastoa aiheesta.
                  • Höpöhöpö dorka, kyselepä varsin huvikseen ns. normaaleilla kanavilla (sellaisilla joita eivät Linux-friikit ole saastuttaneet) mitä clienttejä käytetään. Pari kanavaa kun tuosta vetäisen, ensimmäisellä 16 ihmistä ja toisella 27, niin ensimmäisellä kanavalla jotain muuta kuin mIRC:iä käyttää kokonaista kaksi (vautsi) ja toisella kanavalla näitä vaihtoehtoclientin käyttäjiä näyttää olevan kolme.
                    • Mitäköhän nämä “normaalit kanavat” mielestäsi ovat? Nimeä muutama, niin käyn katsomassa. Toisekseen, otantasihan oli vallan huimaava: kaksi kanavaa muutamasta kymmenestä tuhannesta (ilmeisesti molemmat samassa verkossa) ja kokonaista 43 ihmistä niistä sadoista tuhansista, jotka IRC:tä käyttävät. Jos jatketaan samalla linjalla, niin minäkin voin käydä vaikkapa Freenoden kanavalla #perl, jossa on populaa kuin pipoa (390, kun viimeksi tarkistin) ja jossa irssi ja kvirc hallitsevat. (Tämähän ei tietysti käy sinulle, koska kaikki Perlistä puhuvat ovat taatusti “Linux-friikkejä”. Tiedoksi: tuolla kanavalla on myös paljon OpenBSD-, FreeBSD- ja MacOS X -käyttäjiä sekä liuta Windows-käyttäjiä.) Sekä sinun että minun tilastointini ovat malliesimerkkejä siitä, miten tilastoja ei todellakaan kuulu tehdä.
                      • Tässä on mennyt keskustelu turhaksi meuhkaamiseksi. Vaikka tarkkoja tilastoja ei ole, voitanee todeta että on hyvin todennäköistä, että mIRC on suosituin ohjelma. Vaikka ei olisi, vaan omaisi vaikkapa 45% käyttäjämääristä, ongelma silti säilyy. Jos aletaan tilastoista parkumaan niin haluaisin nähdä tilaston siitä miten muissa pohjoismaissa UTF-8 on jo pitkällä? Tälläistä tuolla sivuilla väitetään, en ole kuitenkaan mitään tilastoa nähnyt asiasta. Tässä selkeästi toinen osapuoli ei tajunnut että nämä ihmiset jotka eivät ole tietotekniikasta kiinnostuneita suuremmin, ja irkkaavat, käyttävät useimmin mirkkiä. Varsinkin linux-käyttäjien piireissä toki asia korostuu päinvastoin kun ei ole edes mirkkiä mitä käyttää, ja linuxia käyttävät ihmiset ovat yleensä tuttuja laitteidensa kanssa. Nämä ihmiset ei vain nykyään enää ole keskimääräisiä ircin käyttäjiä, vaan käyttäjäkunta koostuu nykyään yhä enemmän ihmisistä joilla ei ole minkäänlaista teknistä taustaa tai sen kummempaa ymmärtämystä. Voi tietysti pistää pään puskaan ja vaatia tilastoja vaikka tuomionpäivään asti asioista mutta kyllä jotain realiteettien tajua pitäisi olla. Jos ei asiaa usko, ja meidän meuhkaukset tuntuvat täysin järjenvastaisilta, järjestä jonkinmoinen tutkimus asiaan, mutta koko asian pistäminen merkityksettömäksi juupas-eipäs -väittelyksi sen takia ettei ole hullun isoa tutkimusta asiasta, on vain ja ainostaan typerää.
  • Huhujen mukaan myös mIRCiin on tulossa UTF-8-tuki. Joku saa vahvistaa tämän. Ja mIRCin käyttö on usein muutenkin varsin kyseenalaista, sillä vain harva käyttäjä noudattaa sen käyttöehtoja.
  • “Support for UTF-8 is on my to-do list. I haven't a chance to look into it yet though, will definitely be doing so at some point.” - Khaled, helmikuussa 2003. Sittemmin mIRCin kehitys on tunnetusti ollut aikalailla jäissä. mIRC foorumi
  • mIRC-käyttäjien olisi hyvä vaatia rahoilleen parempaa vastinetta. (Ja jos joku ei ole maksanut, vaikka mIRCiä käyttää, niin ohjelman vaihto jo pelkästään lisenssiehtojen noudattamiseksi olisi suotavaa.)
    • Mikään ei sinänsä velvoita noudattamaan lisenssiehtoja. Lisäksi Khaledille tuskin koituu siitä mitään taloudellista tai henkistä haittaa, jos käyttäjä jatkaa mIRCin käyttöä sen sijaan että vaihtaa johonkin toiseen ohjelmaan. Päin vastoin. Tuohon mIRCin täysversion maksullisuuteen on siis turha vedota.
  • Niin kauan kuin irc-serveriohjelmisto (ircd) ei tue UTF-8:aa ei ole järkeä käyttää UTF-8:aa.
    • IRCnet esimerkiksi sanoo-!- PENALTY FNC EXCEPTS=e INVEX=I CASEMAPPING=ascii NETWORK=IRCnet are supported by this server - Eli vain ASCII merkistö on tuettuna (muut merkit menevät serverin läpi miten menevät, todellinen tuki VAIN ASCII-merkeille 0-127)
    • UTF-8 on tulossa IRCnetin ircd:hen muutaman vuoden kuluessa, versioon 2.11.3 ircd roadmapin mukaan (lista jonka mukaan pääasiassa Beeth kehittää ircd:tä eteenpäin) http://akson.sgh.waw.pl/~chopin/ircd/ROADMAP
  • Tuo sivun alussa oleva “Ongelman syynä on se, että IRC-protokolla ei mahdollista käytetyn merkistön ilmoittamista, jolloin eri merkistöjä käyttävät ohjelmat voivat näyttää osan merkeistä väärin.” on väärin.

ircd nimenomaan ilmoittaa yllä mainitun ASCIIn josta tuetaan vain 128 ensimmäistä merkkiä.

  • Mitenkä olis jos ensin kattelisitte mitä mikäkin serveri tukee ja sen perusteella harkitsisitte uudemman kerran UTF-8 käyttämistä IRCissä?
  • Zurna.Net tukee UTF-8 verkossaan, muutenkin melko kattavat koodisivut mitä ko. verkko tukee. http://irc.netsplit.de/networks/details.php?net=Zurna.Net
  • Kyseinen CASEMAPPING-merkistö liittyy kanavien ja nickien nimiavaruuksiin. Kun irkissä isoja ja pieniä kirjaimia kohdellaan identtisinä, täytyy serverin tietää, minkä merkistön mukaan nämä vertailut tehdään. Antaessaan merkistöksi asciin, serveri ottaa kantaa siihen, ettei se kohtele nickejä ja kanavia mm. RFC1459:ssä esiintyvän vanhan 7-bittisen suomalaismerkistön mukaan, jolloin erilaiset sulut olisivat ekvivalentteja toisten sulkujen kanssa. (Jos näin olisi, antaisi serveri merkkijonon CASEMAPPING=rfc1459.) Tällä palvelinten merkistövalinnalla ei ole nickien ja kanavien ulkopuolella mitään merkitystä ja kun tässä UTF-8-siirtymässähän on nimenomaan kyse viestien merkistöstä, niin tällainen palvelinsovelluksiin liittyvä merkistöspekulaatio osuu harhaan.
  • Hyöty UTF-8:sta on yleisellä tasolla marginaalinen. He jotka sitä tarvitsevat voivat sitä vapaasti käyttää, mutta muiden pakottaminen käyttämään samaa merkistöä on täysin vailla järjellisiä perusteluja
  • Hienointa tässä koko jutussa on se miten kanavat joiden nimissä on ääkkösiä kärsivät. Porukka jakaantuu kahdelle kanavalle. Siellä sitten ihmetellään, että missäs ne kaverit on. Hemmetti että oli taas hyvä idea.
  • IRC:ssä ollaan valitettavasti tästä junasta myöhässä. Uusia junavuoroja on vielä onneksi tulossa, mutta parhaat paikat ovat kohta menneet. Loppuun asti vastahankaan olevat joutuvat lopulta tyytymään resiinakyytiin.” Mikäs sitten on se päivämäärä jolloin niitä junia(tai resiinoita) ei enää kulje? ts. milloin ei enää ole mahdollista siirtua utf-8:iin? 1.1.2006?
    • Resiinakyyti = toimimattomat ääkköset, kun muut ovat vaihtaneet.
      • Ahaa, eli mitään kiirettä ei siis olekkaan. Vaan asiasta voidaan rauhassa keskustella sen sijaan että suinpäin rynnätään rikkomaan jo toimivaa järjestelmää. Voidaan myös pohtia mikä olisi paras tapa siirtya ja millon, sen sijaan että huudettaisiin pää punaisena propagandaa.
        • Siirtymättömillä tuntuu olevan tuo naama punaisena huutamisen -ongelma. Kickbannit jne… Fakta on, että merkittävä määrä myös pelkästään suomalaisia kanavia on jo vaihtanut, ja jankkaamalla “mulle riittää Latin1” venytetään vain siirtymäaikaa. Useimmilla UTF-8-käyttäjillä näkyy myös Latin1-merkistö, mutta ei välttämättä päin vastoin, eli Latin1-käyttäjä häviää.
          • Merkittävä määrä? Varmaan sitten löytyy niitä tilastoja tuon väitteen tueksi? Ja tokihan roskaa lähettävät saavat monoa, kuten itsekin myönsit, utf-8 käyttäjien merkit eivät näy oikein.
            • Onhan niitä jo listattuna täälläkin… Ja hakemalla hakukoneella vaikka “IRC UTF-8 2006” löytyy lisää.
              • Merkittävää määrää? Eli vaikkapa 20% tai enemmän, saa esittää tilaston. Ja jollei tilastoa löydy niin voimme varmaan olla samaa mieltä että “Fakta on, että merkittävä määrä myös pelkästään suomalaisia kanavia on jo vaihtanut” on ns. tuubaa ja esitetty pelkästään propagandatarkoituksessa.
                • Tästä löytyy paljon luotettavia tilastoja, niin kuin IRC:stä yleensäkin :o Koko merkistökoodauskeskustelu on muutenkin juuttunut, eikä lähiaikoina tule johtamaan mihinkään muuhun lopputulokseen kuin että UTF-8:a ja Latin1/9/Windows-1252:n käyttö ristiin jatkuu lähitulevaisuudessa. Oletettavasti pientä siirtymää UTF-8:an tapahtuu jatkuvasti, mutta merkittävä määrä kanavia ei tee muutosta lähiaikoina. Useimmat UTF-8-käyttäjät sopeutuvat käyttämään Latin9:ää (yleensä) niillä kanavilla, jotka eivät suostu “edistyksellisyyteen”, ja päin vastoin Latin-x käyttäjät joko pysyvät poissa UTF-8-kanavilta, tai kärsivät koodauksesta. Useimmat UTF-8-käyttäjät näkevät Latin-x-käyttäjien ääkköset oikein recode fallbackin ansiosta. Jossain vaiheessa - mahdollisesti vuoden kuluttua, tai ehkä kun mIRC tukee UTF-8:aa - UTF-8-kannattajat koettavat masinoida uudelleen yleistä siirtymistä (mikäli hiljainen siirtyminen ei ole ollut oletettua voimakkaampaa).
        • Kommentoija viittaa, että kickban viittaisi pää punaisena huutamiseen. En usko, että yhdelläkään kanavalla potkitaan vain siksi, että joku käyttäisi väärää merkistöä. Potkun syy lienee yksinkertaisesti useimmissa tapauksissa se, että kanavalla koetaan toimimattoman merkkisotkun lähettäminen häiritseväksi, ja varmasti huomautetaan ensin asiasta kohteliaasti. Tämän huomautuksen jälkeen kyseessä on yksinkertaisesti selvä kanavan käytäntöjen rikkominen, josta seuraisi käytöksen jatkuessa varmasti potku myös muissa kuin merkistöä koskevissa käytännöissä.
  • UTF-8 on todellisuutta, ja moni on jo vaihtanut. Muutosvastarinta vain pidentää siirtymäkautta, ja lähinnä häiritsee niiden irkkausta, jotka eivät ole vaihtaneet, sillä suurin osa UTF-8:aa tukevista asiakasohjelmista osaa myös näyttää Latin1:tä.
    • Oman kokemuksen mukaan vaihtanut on täysin merkityksetön määrä.
    • Saahan sitä elää illuusiossa, jos haluaa uskoa tuon olevan “todellisuus”.
  • Laittomasti mIRC ohjelmaa käyttävät, eli siis noin 99% mIRCin käyttäjistä, voisi eka lukea ne ohjelmansa sopimusehdot. Sen jälkeen joko lopettaa valittaminen, kun ohjelman tekijällä ei oo piratismin takia varaa ohjelmaa kehittää, tai maksaa ja odottaa rahoille vastinetta. Toi valittaminen mIRCin UTF-8 kyvyttömyydestä on ihan sama kun valittas täällä miksi kopioitu peli ei toimi. Maksa siitä niin toimii.
    • Kommentin kirjoittaja voisi eka lukea ne Suomen lait. Mikään ei tee mIRCin käytöstä laitonta, vaikka sen käyttöä jatkaa yli kokeiluajan. Toisekseen, vaikka tällainen lakipykälä, joka mahdollisi tällaiset yksipuoleiset sopimusehdot, olisikin olemassa, sekään ei tekisi mIRC:n käytöstä “piratismia” - hienoa että meillä täällä wikissäkin on oma Karpela. Lisäksi haluaisin kuulla, millä logiikalla mIRC:stä maksaminen tuo siihen UTF-8-tuen.
      • Tietenkään ei tarvitse noudattaa lisenssiehtoja. Silloin käyttäjällä on kaikki oikeudet, mitä ohjelman käyttöön olisi ilman ehtoja - eli ei mitään. Sinun logiikallasi olisi toki sallittua kopioida ja käyttää mitä tahansa ohjelmistoja ilmaiseksi. Sinänsä lisenssi on oston jälkeen siirrettävissä jne., eli itse lisenssiehtojen höpinöistä ei tarvitse välittää.
        • Lue nyt ne lait tai opettele ajattelemaan, äläkä väitä laeiksi sitä, mikä sinusta tuntuisi ehkä mahdollisesti oikealta. Käyttäjällä on täydet oikeudet tehdä omalla tietokoneellaan ja omalla mIRCillään ihan mitä tahansa, kunhan ei riko lakia esimerkiksi häiritsemällä tietoliikennettä. Se, missä laki tulee vastaan, on mahdollinen tekijänoikeusrikkomus; esimerkiksi sovellusohjelman kopiointi ilman oikeudenomistajan lupaa. Sen sijaan mIRC:n tekijä on sen itse asettanut vapaasti kopioitavaksi sivuilleen, eikä minkään lain nojalla voi Suomessa asettaa rajoittavia lisenssiehtoja, jotka olisivat lainvoimaisia ilman erillistä kirjallista sopimusta (jollaiseksi I Agree -painallusta ei katsota). Kyse ei ole mistään “sinun” tai “minun” logiikasta, jota voisi muka laajentaa johonkin muihin tapauksiin. Mutta kyllä - minun logiikassani mitä tahansa laillisesti hankittua ohjelmistoaan saa käyttää ilmaiseksi. Tämä ei ole vain minun logiikkani vaan yksinkertainen lakitekninen asia. mIRC:n lataamisessa sen kotisivuilta käyttäjä ei riko tekijänoikeuslakia.
          • Lähtökohta on, että jos joku on tehnyt ohjelman, ei muilla ole oikeutta sitä käyttää. Kirjoitit, että käyttäjällä on oikeus tehdä omalla mircillään mitä haluaa. Mirc ei kuitenkaan ole käyttäjän oma, ei tekijä luovu tekijänoikeudestaan laittamalla ohjelman saataville verkkoon. Tekijä voi kuitenkin antaa tietyin ehdoin luvan käyttää sovellusta. Näitä ehtoja kutsutaan lisenssiksi. Mikäli et noudata lisenssin ehtoja, et ole oikeutettu käyttämään softaa. Lisenssin rikkominen sinänsä ei ole rikos, mutta rikot tekijänoikeuslakia mikäli et noudata lisenssisopimusta. Hieman samaa asiaa on käyty läpi gpl-lisenssirikkomuksien kohdalla, tosin Ameriikan ihmemaassa eikä Suomessa. Sama lainsäädännölliset periaatteet kuitenkin pätevät, teoksen (ohjelman) tekijänoikeudet säilyvät alkuperäisellä tekijällä vaikka ohjelman (jopa lähdekoodit) laittaisi yleiseen jakoon. Hyvin epätodennäköistä tietysti on että tästä tekijänoikeusrikkomuksesta (ohjelman käyttö lisenssiehtojen vastaisesti) tulisi mitään seuraamuksia. Ihmisen kuitenkin voisi toivoa toimivan sen mukaan, mikä on oikein eikä sen mukaan, mistä ei jää kiinni.
            • (Hieman off-topic mutta olkoon) “ei muilla ole oikeutta sitä käyttää”? Eikös tekijänoikeus koske nimenomaan kopioimista ja muuttamista eikä suinkaan käyttämistä? GNU GPL:kin sanoo “Activities other than copying, distribution and modification are not covered by this License; they are outside its scope.”
              • Offtopic joo, mutta olet väärässä. Tekijänoikeus koskee nimenomaan tietokoneohjelmien tapauksessa myös käyttöä. Näin ainakin Suomessa.
            • Tämän ketjun aloittajalla selkeästi on hiukan ymmärrysongelmia koko asian käsittämisen suhteen. Tuskin kukaan melkein nilittää siitä ettäkö “yhyyyy, en voi siirtyä, mIRCini ei sitä tue”. Vaan se pointti mitä täällä jaetaan tarkoittaa realiteettejä ja oikeita seurauksia. On täysin merkityksetöntä onko n+1 ihmistä maksanut mIRCistä vai ei, ainoastaan merkityksellistä on se, että n+1 ihmistä käyttää mIRCiä ja se ei tue UTF-8 oletuksena. Nyt jos pystyy ymmärtämään tuon asian, voi tehdä johtopäätöksen, että siirtyminen UTF-8 on mahdotonta jollei mIRC muutu UTF-8 tukevaksi ja sanoisinpa että sen täytyisi olle oletusasetuksena TAI joku saa kaikki mIRCin käyttäjät hax0raamaan mirkkinsä tukemaan UTF-8 tai vaihtamaan klienttiä. Itse ainakin pidän edellämainittuja vaihtoehtoja äärimmäisen epärealistisina, jolloin loogisesti pidän koko UTF-8 siirtymistä toistaiseksi epärealistisena.
  • “Unicoden ja latin-merkistöjen välinen taistelu on jo paisuttanut Internetin täyteen kaikenlaista keskustelua. Olisi paljon helpompaa, jos kaikki vain käyttäisivät samaa merkistöä, jolloin kaikki kinastelu loppuisi. Vai haluaako joku edelleenkin jatkaa tätä turhaa tappelua?” - mielenkiintoinen idea ensin itse aloittaa ja pystyttää riita ja sitten yrittää muka sovitella tilannetta ja sillä perustella ajatustaan. Kaikkea sitä näkee.
    • Muutosidea ei ole sama kuin riita. Mistä voitaisiin edes päätellä, että olisi sama taho? Ja tuollaisella tyypillisellä nettiasenteella kaikki liekitykset netissä aina paisuvat, kunnes kuolevat kokoon ihan muusta syystä kuin sopimalla.
      • “Muutosidea ei ole sama kuin riita.” Muutosidea ei, mutta UTF-8-koodauksen suoltaminen irkkiin eli idean toteutus on niin selvä riidan avaus, että jos joku väittää tosissaan muuta, nauran. Päin vastoin, muutosidea on oikein hyvä, ja sen sijaan, että aletaan kaivaa verta nenästä häiriköimällä keskeneräisellä ja siksi toimimattomalla idealla, olisikin viisaampaa kehittää ideaa eteenpäin. Jotkut kehityksen kanssa työskentelevätkin; vauhti on hidas, mutta toisaalta enpä näe, miksi yhtäkkiä olisi tullut pakottava tarve siirtyä yleisesti Unicodeen irkissä juuri täsmälleen nyt. Toiset, malttamattomat ja kovin kapean ATK-alan maailmankatsomuksen omaavat, aiheuttavat vain hallaa IRC:n oikealle kehitystyölle häiriköimällä toteuttamalla (usein hyvässä uskossa) ajatustaan, joka ei olekaan sellaisenaan kelvollinen.
    • Päivitin, tein aika paljon lisäyksiä.
      • Haluaisin ensiksi nostaa hattua hyvin kirjoitetusta artikkelista. Todellisuuden vakituinen noteeraus jää useimmille tekemättä hurmoksen keskellä. Mutta asiaan: Artikkelista saa vääjäämättä kuvan siitä, että UTF-8 villitys syntyi noin parin kuukauden sisällä (joka kuolee nopean mutta hiljaisen kuoleman). Sitähän se ei ole, vaan pelkästään osa pitkään käytyä IRC-maailman merkistö”sotaa”. Siitä lähtien kun esim. Mozillan kaltaisten softapakettien mukana tulleitten irc-klienttien perusasetuksena päätettiin pistää tulostamaan UTF-8:a, oli selvää että ISO-merkistöjen kanssa tulee olemaan ongelmia. Voidaanko heitä (ohjelmoijia/käyttäjiä) syyttää “tahallisesta häiriköinnistä?” (Minua muuten kiinnostaisi tietää heidän motiivinsa asian päätöksestä. Ehkäpä varmaan merkistön suhteellisen kivuton kansainvälisyys edesautti asiaa?) Se, miksi asiasta ei puhuttu “asiantuntijoiden” kanssa en osaa sanoa, mutta oli miten oli, vahinko tuli tehtyä. Nykyään irssin kaltaisiin ohjelmiin on lisätty toimintoja ISO/UTF-8-kanavia silmälläpitäen, ja niin kauan kunnes ircd saa kuin saa UTF-8 tukensa kuntoon, tilanne luultavasti pahenee/paranee. Lainatakseni Billy Joelia: “We didn't start the fire, it was always burning…” ;-)
    • Päivitin uudestaan, nyt kun Mirkkiin on tullut tuki.
  • Tässä uusi WWW‐sivu suomenkielisille Unicode‐käyttäjille: Suomen kielen kirjoittaminen Unicodea käyttäen. Tuo kyllä asettaa aika kyseenalaiseen valoon ne väitteet, että kyse on vain euronmerkin ja puolikkaanmerkin yhtäaikasesta käytöstä.
  • 17. helmikuuta 2006 lähtien myös mIRC tukee UTF-8.
    • Tosin huonosti. Ihan sama tukeeko se sitä ollenkaan…
      • Works for me.. Millaisia ongelmia olet kohdannut mIRCin UTF-8 -tuessa?
  • Ei juma oikeesti “hidastaa siirtymäaikaa” saanko kysyä että mikä hiton siirtymäaika? kuulostaa niinkuin olisi joku helvetin laki tullut joka määrää UTF-8 käytön. Äly hoi. Oikeesti ei mua vähempää vois kiinnostaa alkaa sählään jotain UTF-8 vaikka se niin olis helppo parin napin painalluksella laittaa ei kiinnosta ei ei ei! miksi se on eräille oikea pakkomielle käyttää UTF-8? “Se toimii paremmin”. ya right! Tähän vois vaan sanoo vanhan viidakon viisauden, If it's not broken, don't fix it! FFS!
    • Ohjelmistot kehittyvät, ja uudemmissa oletukset muuttuvat. Ennustus UTF-8:n tulosta oletusmerkistöksi yhä useammassa ohjelmistossa perustuu käsitykseen kehityksestä muissa ohjelmistoissa. Jossain vaiheessa on pienempi vaiva muuttaa vanhempia ohjelmia käyttäjien asetuksiaan kuin aina käskeä uusia käyttäjiä säätämään. Sama syy kuin nytkin, tosin vaihtamattomuuden, syy - ei ole tarvetta vaihtaa. Aikataulua en arvioi, paitsi on kyllä hitaampaa kuin kiihkeimmät UTF-8-kannattajat haluaisivat. (Ja siinäkin vaiheessa sinullakin on toki oikeus sählätä merkistöjen kanssa.)
1) Kuten ISO-8859-1 alias Latin 1, ISO-8859-15 alias Latin 9, CP1252, jne.
2) itse luotu, kuvitteellinen ongelma
 
keskustelu/irc_ja_utf-8.txt · Last modified: 2010/01/01 20:02 (external edit)
 
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki