CPAN -- Comprehensive Perl Archive Network -=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= On the Internet, nobody knows you're a dog. -- Cartoon caption Jan Pazdziora, 8. prosince 1997 Perl, jazyk na zpracování textů, správu systému či přístup k databázím, má mnoho možností a funkcí již ze své definice, velice významná je ale možnost použít moduly, které řeší přímo náš úkol, nebo je jen stačí patřičným způsobem rozšířit. Všechny volně dostupné moduly, spolu s Perlovskými distribucemi a dokumentací, jsou shromážděny na CPANu, archívu mirrorovaném na mnoha serverech světa. Tento příspěvek přiblíží obsah archívu a také naznačí, které úkoly se v Perlu řeší tak často, že pro ně existují již hotová řešení. Kde je CPAN Vstupním bodem k CPANu je URL http://www.perl.com/CPAN/, které nás přesměruje k nejbližšímu mirroru. Pokud s defaultním přesměrováním nejsme spokojeni, můžeme odstranit poslední lomítko a vybrat si nejvhodnější server ručně. Na TEN-34-CZ je možno zamířit například na mirror http://www.fi.muni.cz/ftp/pub/cpan. Kategorie modulů Mnoho z úkolů, které se chystáme v Perlu udělat, už pravděpodobně dělal někdo před námi. Soubor modules/00modlist.long.html obsahuje jednak obšírný úvod do problematiky, tedy například i informaci o tom, co to vlastně modul je, jednak seznam existujících modulů, rozdělený na části podle zaměření a se stručnými komentáři ke každému modulu. Uveďme zde skupiny, do.nichž jsou moduly neformálně roztříděny: - základní Perlovské moduly, rozšíření jazyka Perl a nástroje pro tvorbu dokumentace - vývojové nástroje - rozhraní k operačním systémům - sítě a síťování, meziprocesová komunikace - datové typy a nástroje pro práci s nimi - databázová rozhraní - uživatelská rozhraní - rozhraní a emulace jiných programovacích jazyků - soubory, filesystémy, zamykání souborů - zpracování řetězců, textů, parsování, hledání - zpracování parametrů příkazové řádky a konfiguračních souborů - internacionalizace a lokalizace - autentikace, bezpečnost a kryptování - World Wide Web, HTML, HTTP, CGI, MIME - nástroje pro tvorbu serverů a daemonů - archivace, komprese, konverze - obrázky, kreslení a grafika - pošta a Usenet news - řízení výpočtu (zpětná volání a zpracování výjimek) - filehandly a vstupně/výstupní proudy - MS Windows - různé Další obsah CPANu Kromě modulů najdeme na CPANu jednak zdrojové distribuce Perlu samotného v podadresáři src, jednak dokumentaci k Perlu včetně FAQ v adresáři doc. Snad stojí zato upozornit například na doc/perlref-*, což je vysázená referenční příručka v tom formátu, v jakém ji prodává nakladatelství O'Reilly, nebo podadresář doc/FMTEYEWTK, Far More Than Everything You Ever Wanted To Know. Při hledání řešení na CPANu může pomoci také vyhledávání na URL http://theory.uwinnipeg.ca/search/cpan-search.html s nejrůznějšími kritérii hledání. Distribuce modulů Každý modul či balík modulů je šířen jako archív (buď .tar.gz nebo .zip) a je umístěn v adresáři svého autora. Adresáře autorů jsou v podadresáři authors a odkazy většinou jdou přes author/ids s krátkou identifikací každého člověka. Součástí názvu bývá číslo verze a pokud distribuce obsahuje README, je toto na CPANu automaticky dostupné vedle daného archívu. Jak instalovat Tar rozbalíme, přepneme se do vytvořeného adresáře a spustíme perl Makefile.PL make make test make install samozřejmě pokud předchozí fáze proběhly v pořádku. Prvním bodem by jistě mohla být četba dokumentace a doporučení k instalaci, ale kdo čte manuály, pokud nejsou žádné problémy, že ;-) Příkaz perl Makefile.PL vytvoří Makefile, který je nadále svázán (cestami a voláním perlu) s tím interpretem, který byl volán na .PL. Můžeme tedy mít na disku více verzí Perlu a Makefile.PL zajistí, že instalujeme moduly k té správné. Pokud se objeví problémy, je vhodné si přečíst návod, zda jsme neměli nastavit nějakou proměnnou prostředí (kupříkladu \ORACLE\_HOME) či se na instalaci mnohdy předcházenou kompilací jinak připravit. Pokud dojde k chybě až při testech, je možné je pustit znovu jako make test TEST_VERBOSE=1 což nám může pomoci vyhledat chybu na naší straně. Pokud jsme si jisti, že chyba není u nás, je vhodné poslat podrobný popis chyby spolu s verzemi Perlu a modulu autorovi, resp. osobě či mailing-listu zodpovědnému za údržbu. Reakce je většinou velmi rychlá -- pokud o chybě informujeme, máme naději na její rychlé odstranění, pokud ne, nemáme si nač stěžovat. Automatická instalace S distribucí Perlu přichází i modul CPAN, který zjednodušuje instalace a upgrade nových verzí modulů na našem lokálním stroji. Nejjednodušší spuštění perl -MCPAN -e shell nám nabídne interaktivní prompt, který dovoluje: vyhledávat moduly na CPANu a porovnávat jejich verze s verzemi instalovanými, volby (i a m); najít moduly, které mají na CPANu vyšší číslo verze (volba r); spustit instalaci (install), která ale proběhne jen pokud byl v pořádku jak make, tak make test; vytvořit seznam nainstalovaných modulů, abychom pak na jiném stroji či jiné platformě byli schopni rychle nainstalovat stejnou konfiguraci (autobundle, recompile). Modul CPAN při instalaci modulu zajistí stažení distribuce z námi zvoleného CPAN mirroru, přičemž použije buď externí programy nebo knihovnu LWP. Porovná kontrolní součet .taru, rozbalí ho a pak provede posloupnost výše uvedených instalačních kroků. Parametry fungování tohoto správce instalace jsou uloženy na disku, takže se po jeho ukončení neztrácejí. Dokumentace Perl podporuje dokumentaci přímo v souboru modulu ve formátu POD (Plain Old Documentation). Při instalaci je tato dokumentace automaticky přeformátována do podoby manových stránek a ty jsou nainstalovány spolu s vlastním kódem modulů. Dokumentace je tedy on-line dostupná i poté, co jsme distribuční balík v zájmu šetření místem z disku smazali. CGI, MIME Jednou z oblastí, kde je popularita Perlu velice vidět, jsou CGI skripty, neboť množství systémových funkcí spolu s regulárními výrazy a textovými funkcemi dávají možnost rychle se dobrat požadovaného cíle. Obraty jako s/%([0-9a-fA-F]{2})/pack("c",hex(1))/ge; jsou rychlé a efektivní. Ovšem dělat po dvacáté tu samou věc rychle omrzí, a proto existuje například modul CGI, který objektovým způsobem nabízí většinu funkcí pro zpracování vstupu všemi HTTP metodami, manipulaci s předanými parametry i tvorbu například HTML odpovědi. Výhodou je jednak čisté řešení, jednak jistá záruka, že kód vyvíjený a podporovaný Perlovskou komunitou se chová podle psaných i nepsaných standardů a pamatuje i na neobvyklé situace. Typický skript pak může být use CGI; my q = new CGI; # načte vstup if (q->>param('name') and # test parametrů q->>remote_user() eq allow) { print q->>header( -type=>>'text/html; charset=iso-8859-2', -expires=>>'+3d'); # odpověď print q->>start_html(-title=>>' ... \end{verbatim} Podobně například pro práci s MIME formáty je pravděpodobně lepší přímo použít prověřený modul, například MIME::Base64 či MIME::Decoder, než opakovaně vyvíjet obdobný kód. Volnost Perlu jak v otázce typů, tak například při práci s velkými objemy dat, nám vždy dovoluje obrátit se v případě nutnosti na standardní Perlovské prostředky, kterými uděláme rychle potřebné, a pouze pro rutinní části skriptu použijeme funkce z modulu. Z CGI a HTML tedy snadno odskočíme k modulu GD, kterým v reálném čase nakreslíme .gif a ten pošleme spolu s HTTP hlavičkami na výstup, případně si můžeme například tvorbu grafů zjednodušit nadstavbou nad GD, modulem GIFgraph. Nebo můžeme pomocí Mail::Folder procházet archív diskusní skupiny a pro přibližné vyhledání použijeme buď regulární výraz či některý z modulů Text::. LWP, Net Na úrovni přístupu někam po síti pracují moduly Net::, kde za dvojtečkou jsou jména protokolů jako FTP, Time či NNTP. Při jejich použití opět vytvoříme konstruktorem objekt a k němu voláme metody, které se promítají na odpovídající akce použitého protokolu, například use Net::NNTP; my nntp = new Net::NNTP; my group = 'comp.lang.perl.misc'; my @gr; if (@gr = nntp->>group(group)) { Nad protokolem HTTP jsou postaveny moduly LWP::, Library for WWW access in Perl. Poskytují několik úrovní složitosti (a možností), od jednoduchého perl -MLWP::Simple -e \ 'getprint "http://www.perl.com/"' přes třídu HTTP::Request až po široce konfigurovatelný LWP::UserAgent. Databáze Přístup k databázovým strojům z Perlu se v poslední době stává velmi rozšířenou aplikací. Existuje specifikace rozhraní a modul DBI (database interface), které definuje skupinu metod pro připojení k databázi, zaslání SQL dotazu a čtení odpovědi. Pro všechny hlavní databáze pak existují databázové ovladače, DBD::, které převádí tato unifikovaná volání na.volání API jednotlivých databází. Příklad použití use DBI; my dbh = DBI->>connect("dbi:Oracle:prod", user, pass) or die DBI::errstr; my sth = dbh->>prepare("insert into cust values (?, ?, ?)") or die dbh->>errstr(); následované provedením příkazu. Takto psaný program je přenesitelný pod jinou databázi pouhou změnou parametru ve volání connect. Protože ale je více než jeden způsob, jak věci dělat, můžeme samozřejmě používat i nestandardní rozšíření definovaná databází a ovladačem, která mohou být rychlejší, ale také neportabilní. Jádro většiny ovladačů je psáno v jazyce C a pro jeho kompilaci je nutná alespoň minimální část vývojového prostředí k dané databázi. Vždy je nutné přečíst si README, kde jsou požadavky pro instalaci konkrétního ovladače vyjmenovány. Jeden z velmi zajímavých ovladačů je DBD::pNET, který funguje jako proxy pro přístup k databázi na vzdáleném stroji. Mějme například Informix na Solarisu, s vývojovým prostředím, k němuž chceme přistupovat z Linuxového stroje. Informix pro Linux nemáme, a proto nemůžeme zkompilovat driver na Linuxu a použít přímo síťovou podporu databáze (navíc mnohdy za speciální peníze). Můžeme ale zkompilovat DBD na Solarisu a spustit na něm tzv. pNETagenta, daemona, který požadavky přicházející z Linuxového stroje pošle databázi a zpět zprostředkuje výsledky. Přenos dat je možno mít kryptovaný a přístup povolený například jen pro konkrétní stroje. výheň