Konkursy — instrukcja

Na początek ściągnijcie program Notepad++, np. stąd i zainstalujcie go. Kiedy już go będziecie miały, możecie zabrać się za przerabianie. Uwaga: żeby polskie literki nie robiły nam niespodzianek, pracujcie w kodowaniu UTF-8 (Format → Konwertuj na format UTF-8).

O XML-u ogólnie

XML jest bardzo wygodnym sposobem trzymania różnych danych, nawet takich z bogatą strukturą. Wygląda jak zwykły tekst, w którym występują tzw. znaczniki (inaczej tagi albo elementy). Jeśli widziałyście kiedyś, jak wygląda html, wiecie, o co chodzi.

Elementy mogą mieć w środku zawartość tekstową, inne elementy oraz mogą być wyposażone w atrybuty. Każdy znacznik musi być zamknięty. Uwaga: liczy się wielkość liter; wszystkie tagi, których używamy, niech będą pisane wyłącznie małymi.

Nasz XML

Rodzaje używanych znaczników i atrybutów definiujemy sobie sami. U nas wygląda to następująco: dla każdego konkursu jest element konkurs, z atrybutem id, wewnątrz którego są elementy nazwa, organizator, jeden lub wiele (albo też wcale :) ) elementów cel i tak dalej. Ściągnijcie i obejrzyjcie sobie plik konkursy-kuba.xml (obejrzyjcie w tym podarsowanym notatniku, o którym piszę na początku i w którym będziecie wprowadzać dane do swoich plików; jeśli otworzycie ten plik w przeglądarce, będziecie miały jedną wielką kaszankę — ciągły strumień tekstu — a tutaj chodzi o to, żebyście zobaczyły strukturę).

Myślę, że najlepiej będzie, jeśli utworzycie nowy plik, np. konkursy-nowe.xml (albo wręcz po jednym nowym pliku na łebka, żeby można było wstukiwać równolegle), w którym w elemencie głównym konkursy (głównym czyli takim, wewnątrz którego jest de facto cały dokument) będą znajdować się elementy konkurs z odpowiednimi danymi.

Plik konkursy-kuba.xml jest podłączony do strony znajdującej się pod adresem http://sem.edu.pl/konkursy/. Zajrzyjcie tam w wolnej chwili i trochę sobie poklikajcie, żeby zobaczyć, co mniej więcej daje trzymanie tych danych w formie XML-a (w skrócie: możliwość wyszukiwania po różnych kategoriach połączona z dosyć rozwiniętymi opisami).

Dopisywać powinnyście analogicznie, jak jest w istniejącym pliku. Poniżej omówię poszczególne elementy.

konkurs — element, wewnątrz którego siedzą wszystkie dane na temat danego konkursu. Ma atrybut id, który trzeba jakoś samemu wymyślić; ważne, żeby był unikalny (ale na razie nie musicie bardzo dbać o unikalność — kiedy Wasz XML będzie gotowy, wtedy to sprawdzę automatycznie i ewentualnie popoprawiam gdzie trzeba);
nazwa — pełna nazwa konkursu
organizator — nazwa organizatora
cel — pojedynczy cel konkursu. Tych elementów może być wiele, może też nie być żadnego (ustawione jest, żeby w takim wypadku wyświetlał bodajże brak danych, ale zawsze to można przestawić);
adresaci — na razie czysty tekst, ale trzeba temu będzie dorobić jakieś kategorie, po których będzie można wyszukiwać, np. „szkoła podstawowa”, „gimnazjum” etc.; pomyślimy o tym, jak przestukacie podstawowe dane dla nowych konkursów; przymiarką do tego jest tag adr, ale nie jest do końca przemyślany — będę to musiał skonsultować z Wami;
led — liczba edycji (notacja bardzo skrótowa, żeby nie trzeba było za dużo klepać w klawisze :) ). Ma pustą zawartośc (czyli tag jest zamknięty — przed > jest ukośnik), ale za to jeden atrybut: w (jak wartość; oczywiście liczbowa);
dost, dpie — data ostatniej/pierwszej edycji. Wartość (atrybut w) jest postaci 2007-04-15 lub 2007-04, lub 2007. Rok-miesiąc-dzień, koniecznie w tej kolejności, miesiąc i dzień koniecznie dwucyfrowo;
zasieg — zasięg terytorialny; w atrybucie typ wpisujemy jedną z trzech literek: m (jak międzynarodowy), k (jak krajowy) lub r (jak regionalny). W tym ostatnim rodzaju wpisujemy jeszcze region jako tekstową zawartość (jeśli regionem jest województwo, piszemy tylko np. lubelskie, a nie województwo lubelskie). Tagów zasieg może być kilka dla jednego konkursu;
liczba-uczestnikow — zawartość opisowa oraz atrybut kat (jak kategoria). Kategorie, które wymyśliły dziewczyny z Białegostoku, są następujące: -50, 50, 200, 1000, 2000 (odpowiednio: poniżej 50 uczestników, od 50 do 200, od 200 do 1000, od 1000 do 2000 oraz powyżej 2000);
forma — forma konkursu. Ma zawartość opisową oraz dwa atrybuty pozwalające na wyszukiwanie: et, czyli liczbę etapów (możliwe wartości: 1, 2 lub w (od wiele)) oraz r, czyli rodzaj (i, d lub id — indywidualne, drużynowe lub indywidualno-drużynowe);
formula-zadan — formuła, czyli rodzaj zadań. Ma zawartość opisową oraz atrybut typ o następujących możliwych wartościach (cytuję): z — Zadania zamknięte (testy), o — Zadania otwarte, m — Mieszane, i — Inne np. napisanie pracy, wykonanie projektu albo pomocy dydaktycznej;
nagrody — zawartość czysto opisowa. Możemy pomyśleć nad jakimiś kategoriami;
mail, www — nie wymagają komentarza.

Wewnątrz złożonych opisów możemy używać zwykłych znaczników html, np. jeśli chcemy dany tekst zawrzeć w paru akapitach, każdy akapit zamykamy w znaczniku p, czyli jakoś tak: <p>[treść akapitu]</p>. Jeśli chcemy jakąś listę wypunktowaną, walimy znacznik ul, czyli listę, wewnątrz którego umieszczamy ileśtam znaczników li, czyli elementów listy (przykład użycia w konkursie Dogonić Piotra Crügera). Jeśli chcemy coś wyróżnić, czyli puścić w cudzysłowie, zamykamy to w znacznik q (przykład w tym samym konkursie). Jeśli potrzebujemy przejść do nowej linii, walimy znacznik <br/> (ale ładniej jest stosować akapity).

Powyższy schemat nie uwzględnia wszystkich rodzajów kategorii, bo nie wszystkie były gotowe, kiedy dziewczyny dały mi źródła do przerabiania. Nad nieuwzględnionymi kategoriami będziemy musieli pogadać, bo trzeba będzie ustalić jakiś format dla nich. Na razie proponuję, byście wprowadziły z nowych konkursów istniejące kategorie.

Znowu ogólnie o XML-u

To co napisałem wcześniej powinno Wam w zupełności wystarczyć, ale jeśli chcecie się wgłębić, możecie spróbować przebrnąć jeszcze przez niniejszą część.

XML musi mieć mniej więcej postać

<element-glowny>
	<element>tekst teskt tekst</element>
	<element>
		tekst tekst
		dużo
		tekstu
		i w ogóle
		<zagniezdzone>
			<elementy>z tekstem</elementy>
			z większą ilością tekstu
		</zagniezdzone>
	</element>
	<element atrybut="mielonka" kolor="różowy" twardosc-w-skali-mohsa="1" w-innych-ciapkach='no właśnie'>
		wnętrze elementu
	</element>
	<element-bez-zawartosci jakis-atrybut="17"/>
</element-glowny>

Generalnie: elementy mogą być w elementach, mogą mieć zawartość tekstową, mogą mieć atrybuty. Jeśli wewnątrz elementu fabryka-mielonki otworzymy element puszka-mielonki, to musi być on zamknięty, zanim zamkniemy element fabryka-mielonki. Złe podomykanie tagów będzie najczęstszą przyczyną, dla której dokument będzie niepoprawny składniowo. Nie ma cudów, przy tej wielkości dokumentach nie da się wyprodukować od razu poprawnego XML-a. Jeśli będziecie korzystać z walidatora (poniżej), nauczycie się wkrótce błyskawicznie znajdować niepodomykane tagi. Notabene, edytor Wam to ułatwia — wystarczy kliknąć w znacznik zamykający lub otwierający i od razu jest podświetlany ten drugi z pary. Elementy w tym edytorze można też zwijać i rozwijać.

Aby ułatwić sobie wyłapywanie błędnie podomykanych tagów oraz generalnie łapanie się w strukturze danego dokumentu, róbcie wcięcia. Element bardziej zagnieżdżony ma być bardziej wcięty niż mniej zagnieżdżony. Przykład:

<opis>
	<p>Krótki akapit.</p>
	<p>
		Bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, 
		bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo, bardzo długi akapit.
	</p>
	<p>Krótki akapit z <i>krótką wstawką</i>.</p>
	<element>
		tekst tekst tekst
		<podelement>
			tekst tekst tekst...
		</podelement>
	</element>
</opis>

Wcięcia robimy oczywiście tabem.

Ponieważ dla XML niektóre znaki są specjalne (np. <, >, &), trzeba je wprowadzać w specjalny sposób — dla podanych przykładów odpowiednio <, >, &.

Czy dany plik jest poprawny, łatwo sprawdzić za pomocą jakiegoś walidatora, np. http://www.xmlvalidation.com/. Trzeba wkleić tekst XML-a do okienka i kliknąć w „validate”.

Przepraszam Was bardzo, że ten tekst jest taki rozwlekły, ale nie umiem pisać jednocześnie zwięźle i precyzyjnie. Jeśli czegoś nie rozumiecie lub macie jakiekolwiek wąpliwości — spróbuję to wytłumaczyć jakoś inaczej. Ale na razie proponuję, byście po prostu wprowadziły nowe konkursy analogicznie do wprowadzonych.

Kuba