Obsah
pgScript se skládá z příkazů pgScript:
příkaz pgScript : normální příkaz PostgreSQL SQL (SELECT INSERT CREATE ...) | deklarace nebo přiřazení proměnné (DECLARE SET) | řídící struktura (IF WHILE) | procedura (ASSERT PRINT LOG RMLINE)
Názvy příkazů (SELECT, IF, SET, ...) nejsou
citlivé na velikost písmen a musí být zakončené středníkem ;
. Identifikátory jsou citlivé na velikost písmen.
DECLARE @I, @T; -- Názvy proměnných začínají s @ SET @I = 0; -- @I je celé číslo WHILE @I < 20 BEGIN SET @T = 'tabulka' + CAST (@I AS STRING); -- Přetypování @I CREATE TABLE @T (id integer primary key, data text); SET @I = @I + 1; END
DECLARE @I, @J, @T, @G; SET @I = 0; SET @G1 = INTEGER(10, 29, 1); /* Generátor náhodných celých čísel Jedinečné číslo v rozsahu 10 až 29 */ SET @G2 = STRING(10, 20, 3); /* Generátor náhodných řetězců 3 slova v délce 10 až 20 znaků */ WHILE @I < 20 BEGIN SET @T = 'tabulka' + CAST (@I AS STRING); SET @J = 0; WHILE @J < 20 BEGIN INSERT INTO @T VALUES (@G1, '@G2'); SET @J = @J + 1; END SET @I = @I + 1; END
DECLARE @I, @T; -- Deklarace je volitelná SET @I = 0; WHILE 1 -- Vždy pravda BEGIN IF @I >= 20 BREAK; -- Opustit smyčku pokud @I > 20 SET @T = 'tabulka' + CAST (@I AS STRING); DROP TABLE @T; SET @I = @I + 1; END
SET @PROGR@M#TITLE = 'pgScript'; PRINT ''; PRINT @PROGR@M#TITLE + ' vlastnosti:'; PRINT ''; PRINT ' * Normální příkazy PostgreSQL'; PRINT ' * Jazyk pro řízení běhu'; PRINT ' * Lokální proměnné'; PRINT ' * Generátory náhodných dat';
V skriptu pgScript můžete spustit LIBOVOLNÝ dotaz PostgreSQL KROMĚ tohoto jednoho:
BEGIN; END;
To je proto, že BEGIN a END se používají k oddělení bloků. Místo toho použijte:
BEGIN TRANSACTION; END TRANSACTION;
Seznam příkazů PostgreSQL: http://www.postgresql.org/docs/8.3/interactive/sql-commands.html
Jsou dva hlavní typy proměnných: jednoduché proměnné a záznamy (množiny výsledků složené z řádků a sloupců).
Názvy proměnných začínají s @
a mohou se skládat z písmen,
číslic, _
, #
, @
.
Typ proměnné se odhadne automaticky v závislosti na druhu hodnoty, kterou obsahuje. Může to být jeden z těchto: číslo (reálné nebo celé), řetězec, záznam.
Deklarace jednoduché proměnné je volitelná.
DECLARE @A, @B; DECLARE @VAR1;
Provádí se příkazem SET. Typ proměnné závisí na hodnotě, která je do ní přiřazená.
SET @A = 1000, @B = 2000; -- @A a @B jsou celá čísla SET @C = 10e1, @D = 1.5; -- @C a @D jsou reálná čísla SET @E = 'ab', @F = 'a''b'; -- @E a @F jsou řetězce SET @G = "ab", @H = "a\"b"; -- @G a @H jsou řetězce
Neinicializované proměnné se automaticky nastaví na prázdný řetězec. Proměnnou je možné libovolně přepisovat.
PRINT @A; -- Vytiskne prázdný řetězec SET @A = 1000; -- @A je inicializováno jako celé číslo PRINT @A; -- Vytiskne 1000 SET @A = 'ab'; -- @A se změní na řetězec PRINT @A; -- Vytiskne ab
Generátory dat umožňují uživatelům generovat náhodné hodnoty. Je několik typů generátorů, každý generuje různé typy dat. Proměnná inicializovaná generátorem se chová jako běžná jednoduchá proměnná, akorát že při každém použití má jinou hodnotu.
SET @A = INTEGER(100, 200); PRINT @A; -- Vytiskne celé číslo z rozsahu do 100 do 200 PRINT @A; -- Vytiskne jiné celé číslo z rozsahu od 100 do 200
Proměnná může obsahovat generátor, ale její typ je jeden z následujících: číslo (reálné nebo celé), řetězec. Seznam dostupných generátorů a k nim přidružených typů najdete v kapitole Generátory náhodných dat.
Deklarace záznamu je povinná. Musí být uveden název každého sloupce i když nebude později použitý.
DECLARE @R1 { @A, @B }, @R2 { @A, @C }; -- Dva záznamy se dvěma sloupci DECLARE @R3 { @A, @B, @C, @D }; -- Jeden záznam se čtyřmi sloupci
Počet řádků je dynamický: viz následující sekce.
Přístup k určitému místu v záznamu je dán číslem řádku (začíná se od 0) a buď názvem sloupce (uzavřeném do uvozovek) nebo číslem sloupce (začíná se od 0). Takto specifikované místo se chová jako jednoduchá proměnná. Upozorněme, že záznam nemůže obsahovat další záznam.
SET @R1[0]['@A'] = 1; -- První řádek a první sloupec SET @R1[0][0] = 1; -- To stejné umístění SET @R1[4]['@B'] = 1; -- Pátý řádek a sedmý sloupec SET @R1[0][1] = 1; -- To stejné umístění
V předchozím příkladu se vloží automaticky tři řádky mezi první a pátý řádek. Použití neplatného čísla nebo názvu sloupce způsobí výjimku.
Specifikované místo je možné použít jako regulérní proměnnou. A specifikovaný řádek rovněž.
SET @R1[0][0] = @R3[0][1], @A = @R2[0][0]; -- Chová se jako jednoduchá proměnná SET @A = @R1[1]; -- @A se stane záznamem, který obsahuje první řádek z @R1
Nezapomeňte, že nelze použít SET @R1[0][0] = @R2
, protože záznam nemůže obsahovat záznam.
Za to je možné přiřadit záznam do proměnné, v takovém případě není nutné proměnnou deklarovat:
SET @A = @R3; -- @A se stane záznamem, protože je do něj přiřazený záznam
Některé dotazy SQL vrací záznamy. Pokud je dotazem SELECT
, vrací výsledky dotazu. Ostatní dotazy
vrací jednořádkový záznam (true
) pokud dopadly úspěšně, v opačném případě záznam s nulovým počtem
řádků (false
).
SET @A = SELECT * FROM tabulka; -- @A je záznam s výsledkem dotazu SET @B = INSERT INTO tabulka ...; -- @B je jednořádkový záznam, pokud dotaz dopadl úspěšně
Viz Funkce.
Proměnnou je možné změnit z jednoho typu na jiný pomocí funkce přetypování:
SET @A = CAST (@B AS STRING); SET @A = CAST (@B AS REAL); SET @A = CAST (@B AS INTEGER); SET @A = CAST (@B AS RECORD);
Pokud se konvertuje záznam na řetězec, změní se na jeho textovou reprezentaci. Pokud se konvertuje na číslo, nejprve se záznam zkonvertuje na řetězec a potom na číslo (viz konverze řetězců).
Pokud se konvertuje číslo na řetězec, změní se na jeho textovou reprezentaci. Pokud se konvertuje na záznam, změní se na záznam s jedním řádkem a jedním sloupcem, který obsahuje číslo.
Pokud se konvertuje řetězec na číslo, tak pokud řetězec představuje číslo změní se na číslo, jinak se vyvolá výjimka. Pokud se konvertuje na záznam, pokusí se program v řetězci najít vzor záznamu. Pokud ho nenajde provede konverzi na záznam s jedním řádkem a jedním sloupcem, který obsahuje řetězec. Vzor záznamu je:
SET @B = '(1, "abc", "ab\\"")(1, "abc", "ab\\"")'; -- @B je řetězec SET @B = CAST (@B AS RECORD); -- @B se změnilo na záznam s dvěma řádky a třemi sloupci
Zapamatujte si, že řetězec je uzavřený do apostrofů. Řetězec v záznamu musí být
uzavřený v uvozovkách zakončených s \\
(zpětné lomítko je zdvojené, protože
je už i speciálním znakem pro řetězec v apostrovech).
Operace lze provádět pouze mezi operandy stejného typu. Pokud jsou různého typu, lze to řešit přetypováním.
Výsledkem porovnávání je číslo 0 nebo 1.
Porovnávání: = <> > < <= >= AND
OR
Spojování: +
SET @B = @A + 'abcdef'; -- @A musí být řetězec a @B bude řetězec
Logická hodnota: neprázdný řetězec je true
, prázdný
řetězec je false
Inverze logické hodnoty: NOT
Porovnávání bez citlivosti na velikost písmen: ~=
Porovnávání: = <> > < <= >= AND
OR
Aritmetika: + - * / %
SET @A = CAST ('10' AS INTEGER) + 5; -- řetězec '10' se převede na číslo
Logická hodnota: 0 je false
, cokoliv jiného je true
Inverze logické hodnoty: NOT
(poznámka: NOT NOT
10 = 1
)
Aritmetická operace obsahující alespoň jedno reálné číslo vrátí jako výsledek reálné číslo:
SET @A = 10 / 4.; -- 4. je reálné číslo, takže výsledek je reálné číslo: @A = 2.5 SET @A = 10 / 4; -- 4 je celé číslo, takže výsledkem je celé číslo: @A = 2
Porovnávání: = <> > < <= >= AND
OR
Logická hodnota: záznam s nulovým počtem řádků je false
, cokoliv jiného je true
Inverze logické hodnoty: NOT
Porovnávání záznamů je o inkluzi a exkluzi. Pořadí řádků není podstatné. <=
znamená, že každý
řádek v levém operandu má odpovídající v pravém operandu. >=
je opakem. =
znamená,
že musí být pravdivé současně <=
i >=
Porovnávání se provádí na řetězcích: i když záznam obsahuje čísla jako 10
a 1e1
, dostaneme
'10' <> '1e1'
.
IF podmínka BEGIN přikazy pgScript END ELSE BEGIN příkazy pgScript END
Příkazy pgScript jsou nepovinné. Klíčová slova BEGIN a END jsou volitelná v případě, že příkaz pgScript je jen jeden.
WHILE podmínka BEGIN příkazy pgScript END
Příkazy pgScript jsou nepovinné. Klíčová slova BEGIN a END jsou volitelná v případě, že příkaz pgScript je jen jeden.
BREAK ukončí smyčku cyklu WHILE, ve které je uzavřený, zatímco CONTINUE způsobí přechod na další iteraci cyklu, ve kterém byl vyvolaný. RETURN funguje podobně jako BREAK.
WHILE podmínka1 BEGIN IF podmínka2 BEGIN BREAK; END END
Podmínky jsou ve skutečnosti výsledky operací. Například porovnávání řetězců 'ab' = 'ac'
vrátí false
.
IF 'ab' ~= 'AB' -- Porovnávání bez citlivosti na velikost písmen, jehož výsledkem je 1 (true) BEGIN -- Toto nastane END IF 0 -- false BEGIN -- Toto nenastane END ELSE BEGIN -- Toto nastane END WHILE 1 BEGIN -- Nekonečná smyčka: použijte BREAK pro ukončení END
Výsledek dotazu SQL SELECT je možné přímo použít jako podmínku. Dotaz se musí uzavřít do závorek:
IF (SELECT 1 FROM tabulka) BEGIN -- Toto znamená, že tabulka existuje, jinak by podmínka musela být false END
Procedury nevrací výsledek. Musí se použít na samostatném řádku a nelze je přiřadit proměnné.
Výpíše výraz na obrazovku:
PRINT 'Hodnota @A je' + CAST (@A AS STRING);
Vyvolá výjimku pokud je výsledkem výrazu false:
ASSERT 5 > 3 AND 'a' = 'a';
Odebere konkrétní řádek ze záznamu:
RMLINE(@R[1]); -- Odebere druhý řádek @R
Funkce vrací výsledek. Vrácený výsledek můžete přiřadit do proměnné, podobně jako u operace CAST
.
Odstraní přebytečné mezery obklopující řetězec:
SET @A = TRIM(' a '); -- @A = 'a'
Vrátí počet řádků v záznamu:
IF LINES(@R) > 0 BEGIN -- Zpracování END
Vrátí počet sloupců v záznamu:
IF COLUMNS(@R) > 0 BEGIN -- Zpracování END
Generátor náhodných dat můžete do proměnné přiřadit příkazem SET. Proměnná pak bude mít, pokaždé když se použije, jinou hodnotu.
Jinak se proměnná používá tak, jak je běžné:
SET @G = STRING(10, 20, 2); SET @A = @G; -- @A obsahuje náhodný řetězec SET @B = @G; -- @B obsahuje jiný náhodný řetězec PRINT @G, -- Vypíše ještě jiný náhodný řetězec
Běžnými parametry datových generátorů jsou sekvence a semínka.
sekvence znamená, že hodnoty se generují v náhodném pořadí, každá hodnota se ale vyskytne maximálně
jednou, dokud se sekvence nezačne znovu. To lze s úspěchem využít pro sloupce s omezením jedinečnosti UNIQUE
. Např. následující
generátor:
SET @G = INTEGER(10, 15, 1); -- 1 znamená, že se bude generovat sekvence
může generovat třeba takové hodnoty: 14 12 10 13 11 15 14 12 10 13 11
..., kde se každé číslo objeví jen
jednou, dokud se generátor nespustí znovu od začátku.
Parametr sequence musí být celé číslo. Pokud je 0, tak se negeneruje sekvence (výchozí volba), jakékoliv jiné číslo generuje sekvenci.
semínko je celé číslo, které inicializuje generátor. Dva generátory se stejnými parametry a stejným semínkem budou generovat přesně stejné hodnoty.
semínko musí být celé číslo, které se použije přímo k inicializaci generátoru náhodných dat.
Volitelné parametry jsou uvedené v hranatých závorkách.
Generátor : INTEGER ( min, max, [sekvence], [semínko] ); | REAL ( min, max, přesnost, [sekvence], [semínko] ); | DATE ( min, max, [sekvence], [semínko] ); | TIME ( min, max, [sekvence], [semínko] ); | DATETIME ( min, max, [sekvence], [semínko] ); | STRING ( min, max, [počet], [semínko] ); | REGEX ( regvýraz, [semínko] ); | FILE ( cesta, [sekvence], [semínko], [kódování] ); | REFERENCE ( tabulka, sloupec, [sekvence], [semínko] );
INTEGER ( min, max, [sekvence], [semínko] ); INTEGER ( -10, 10, 1, 123456 );
min
je celé číslo, max
je celé číslo, sekvence
je celé číslo a semínko
je rovněž celé číslo.
REAL ( min, max, přesnost, [sekvence], [semínko] ); REAL ( 1.5, 1.8, 2, 1 );
min
je číslo, max
je číslo, přesnost
je celé číslo, které udává počet desetinných míst (mělo by být menší než
30), sekvence
je celé číslo a semínko
je celé číslo.
DATE ( min, max, [sekvence], [semínko] ); DATE ( '2008-05-01', '2008-05-05', 0 );
min
je řetězec představujíc datum, max
je řetězec představující datum, sekvence
je celé číslo a
semínko
je celé číslo.
TIME ( min, max, [sekvence], [semínko] ); TIME ( '00:30:00', '00:30:15', 0 );
min
je řetězec představující čas, max
je řetězec představující čas, sekvence
je celé číslo a
semínko
je celé číslo.
DATETIME ( min, max, [sekvence], [semínko] ); DATETIME ( '2008-05-01 14:00:00', '2008-05-05 15:00:00', 1 );
min
je řetězec představující časové razítko, max
je řetězec představující časové razítko, sekvence
je celé číslo a semínko
je celé číslo.
STRING ( min, max, [počet], [semínko] ); STRING ( 10, 20, 5 );
min
je celé číslo udávající minimální délku slova, max
je celé číslo udávající maximální délku slova,
počet
je celé číslo udávající počet slov (výchozí je: 1
) a semínko
je celé číslo.
V předchozím příkladu se bude generovat 5 slov (oddělených mezerami) s délkou od 10 do 20 znaků.
REGEX ( regvýraz, [semínko] ); REGEX ( '[a-z]{1,3}@[0-9]{3}' );
regvýraz
je řetězec představující jednoduchý regulární výraz a semínko
je celé číslo.
Jednoduchý regulární výraz se skládá z:
Množiny možných znaků, např. [a-z_.]
pro znaky v rozmezí a
až z
+ _
a .
Samostatných znaků.
Lze určit minimální a maximální délku pro předcházející množinu nebo znak:
{min, max}
, např. {1,3}
pro délku v rozmezí 1
až 3
znaky.
{min}
, např. {3}
pro délku 3
znaky.
Výchozí délka (pokud není zadaná) je 1
znak.
Poznámka: dávejte pozor při zadávání mezer, protože např. 'a {3}'
znamená jeden znak a
následovaný třemi mezerami, protože
3
se váže k poslednímu znaku, což je v tomto případě mezera.
Pokud potřebujete zadat [
]
\
{
nebo }
, musíte tyto znaky ošetřit zpětným lomítkem,
protože se jedná o znaky se speciálním významem. Nezapomeňte použít zdvojené zpětné lomítko:
'\\[{3}'
pro tři znaky [
.
FILE ( cesta, [sekvence], [semínko], [kódování] ); FILE ( 'soubor.txt', 0, 54321, 'utf-8' );
cesta
je řetězec představující cestu k textovému souboru, sekvence
je celé číslo, semínko
je celé číslo a
kódování
je řetězec představující znakovou sadu použitou v souboru (výchozí je kódování podle nastavení v systému).
Generují se celá čísla v rozmezí od 1 do počtu řádků souboru a vrátí se příslušný řádek. Pokud soubor neexistuje, vyvolá se výjimka.
Jako kódování
je podporovaná většina známých kódování jako utf-8, utf-16le, utf-16be, iso-8859-1, ...
REFERENCE ( tabulka, sloupec, [sekvence], [semínko] ); REFERENCE ( 'tab', 'col', 1 );
tabulka
je řetězec představující název tabulky, sloupec
je řetězec představující název sloupce tabulky,
sekvence
je celé číslo a semínko
je celé číslo.
Účel použití je pro generování dat do sloupců určených jako cizí klíče.