Vnořené slova aka viditelně zásobníkové jazyky


Original: http://www.cis.upenn.edu/~alur/nw.html

Co jsou vnořené slova?
Vnořené slov jemodel pro reprezentaci dat jak s lineární uspořádání a hierarchicky vnořené párování položek. Příklady údajů s takovou duální lineární – hierarchické struktury jsou popravy strukturovaných programů, komentovaných jazykových dat, a HTML / XML dokumenty. Vnořené slovo se skládá z posloupnosti lineárně uspořádaných poloh, obohacuje se hnízdění hrany spojování hovorů do výnosů ( nebo otevřených značky uzavřete tagy ). Okraje nekříží vytvoření správně vnořené hierarchickou strukturu, a necháme některé z hran, které mají být v řízení. Tento hnízdění struktura může být jednoznačně reprezentována sekvencí, které stanoví typy pozic ( hovory, vrátí, a vestavby ). Vnořené slova zobecnit obě slova, a nařídil stromy, a aby i slovo a stromů operace.

Vnořené slovo automaty — konečný stav akceptory pro vnořené slova, definovat třídu regulárních jazyků vnořených slov. Tato třída má všechny atraktivní teoretické vlastnosti, které jsou klasické pravidelné slovní jazyky se těší : deterministické vnořené slovo automaty jsou tak výrazné jako jejich nedeterministickými protějšky; třída je uzavřená pod sjednocení, průnik, doplnění, zřetězení, Kleeneho – *, předpony a jazykové homomorfismy; členství, prázdnota, jazykové začlenění a jazykové ekvivalence jsou decidable; a definovatelnost v monadického logiky druhého řádu odpovídá přesně na konečný – státní rozpoznatelnost. Tyto výsledky zobecnit na nekonečno vnořené slova také.

 
Jak to, že se vztahují k bezkontextových jazyků slov?
Vzhledem k tomu,jazyk L vnořených slov nad abecedou,lineární kódování vnořených slov dává jazyk L ‘ nad značeného abecedy, kterou tvoří symbolů obsahujících štítek typu pozice. Jestliže L je regulární jazyk vnořených slov, pak L ‘ je kontext – volný. Ve skutečnosti,zásobníkový automat přijímá L ” má zvláštní strukturu : při čtení hovor, musí býtautomat tlačit jeden symbol, při čtení symbol zpáteční, musí pop jeden symbol (je-lizásobník je neprázdný ), a při čtení interní symbol, lze aktualizovat pouze své kontrolní stav. Říkáme takové automaty viditelně zásobníkové automaty atřída slovních jazyků přijímají viditelně zásobníkové jazyky ( VPK ). Protože naše automaty mohou být determinized, VPLS odpovídají podtřídy deterministických bezkontextových jazyků ( vlámského ). VPLS zobecnit na paranthesis jazyků, v závorkách jazyků a vyvážené jazyků, a mají lepší vlastnosti uzavírací než CFL, DCFLs, nebo paranthesis jazyků.

Tvrdíme, že pro algoritmické ověření strukturovaných programů, neotvírat program jako kontext-volná jazyka nad slovy, je třeba jej vnímat jako běžný jazyk vnořených slov ( nebo ekvivalentně, viditelně zásobníkového jazyka ), a to by umožnilo modelu kontrola z mnoha vlastností (např. zásobník inspekce, pre -post podmínek ), které nejsou vyjádřitelné ve stávajících specifikací logiky.

Obecně lze říci, zásobníkové automaty slouží dva různé účely : Objevování hierarchické párování a zpracování / dotazu na shodu. V aplikacích, kde teprvedruhý účel je důležité ( jako v analýze programu), lze nahradit zásobníkové automaty s nbyl v pořádku s mnoha výhod.
Jak to, že se týkají objednat stromy?
Údaje s duální lineární, hierarchická struktura je tradičně modelována pomocí binární, a obecněji, pomocí objednané nehodnocené, stromy, a dotazovat pomocí stromové automaty. V objednané stromy, uzly se stejným rodičem jsou lineárně objednal, a klasické strom traversals, jako infix ( nebo hloubku – první zleva doprava) lze použít k definování implicitní uspořádání všech uzlů. Ukazuje se, že, živé ploty, kdyzajištění jeposloupnost uspořádaných stromů, jsouspeciální třída vnořených slov, konkrétně ty odpovídajících Dyck slova a pravidelné zajišťovací jazyky odpovídají vyvážených jazyků.

Pro zpracování dokumentů, vnořené slova přece mají mnoho výhod oproti objednaných stromů. Zastoupení stromů na bázi implicitně předpokládá, že vstupní lineární data mohou být analyzován do stromu, a tak nikdo nemůže reprezentovat a zpracovávat data, která nemusí správně analyzovat. Word operace jako předpon, přípon a zřetězení, zatímco přirozené, zpracování dokumentů, nemají obdobné strom operace. Za druhé, stromové automaty lze přirozeně vyjádřit omezení na pořadí štítků po hierarchické cestě, a také podél levé – k-pravý sourozenci, ale mají potíže zachytit omezení, které odkazují na globální lineární pořadí. Například,dotaz, který vzory p1,… pk se v dokumentu v tomto pořadí kompiluje do deterministického automatu slovo ( a tedy deterministické NWA ) lineární velikost, ale standardní deterministické bottom- up tree automat pro tento dotaz musí být velikost exponenciální k.. Nbyl v pořádku může být viděn jako druh stromových automatů tak, aby oba bottom-up stromové automaty a top -down tree automaty jsou speciální případy. Tyto výsledky naznačují, žedotaz může být stručně zakódováno v vnořených slov, zobrazení se složitosti těžívnořené slovo automat přečte slovo zleva doprava, zpracování hnízdění hrany, jak a kdy dorazí. To odpovídá s SAX API pro XML, a tak má přirozenou použití v streaming algoritmů.

Odkazy
Model vnořených slov prošel několika iterací : Viz Viditelně zásobníkové jazyky; Alur a Madhusudan; STOC 2004; a Přidání hnízdění strukturu slov; Alur a Madhusudan; DLT 2006. Doporučujeme přečtení tohoto jednotného plnou verzi ( Journal of ACM, 2009 ). Pozván mluvit u CSR 2007 je takédobrým výchozím bodem.

Došlo k rozsáhlé sledování výzkumu. Zejména Mozafárí et al navrhli a implementovali dotazu procesor pro XML dokumenty kořeny v této teorii state- of-the – art ( viz Vysoce výkonné zpracování komplex pro pořádání akcí, přes potoky XML, vítěz z nejlepších papíru ocenění v SIGMOD 2012 ); a Driscoll et al zavedli různé stavby na nbyl v pořádku do open-source knihovny OpenNWA (CAV 2012), které byly použity pro celou řadu problémů v analýze programu.

Účelem této stránky je sledovat z nejnovějších výsledků souvisejících toto téma. Napište mi, s komentáři a / nebo navrhl dodatky.
Další rozhodnutí Problémy dobrovolných dohod o partnerství / nbyl v pořádku

Viditelně zásobníkové hry; Plnicí, Madhusudan, a Serre; FSTTCS 2004.
Viditelně zásobníkové automaty : Od jazyka rovnocennosti simulace a bisimulace; Srba; CSL 2006.
Pravidelnost problémy viditelně zásobníkovými jazycích; Barany, Plnicí a Serre; STACS 2006.
Na problém členství pro viditelně zásobníkovými jazycích; La Torre, Napoli, a Parente; ATVA 2006.

Kongruence a minimalizace

Kongruence pro viditelně zásobníkovými jazycích; Alur, Kumar, Madhusudan, a Viswanathan; ICALP 2005.
Minimalizace, učení a shody testování booleovských programů; Kumar, Madhusudan, a Viswanathan; Se shodují v roce 2006.
Minimalizace varianty viditelně zásobníkových automatů; Chervet a Walukiewicz; MFCS 2007.

Časová a Fixpoint logiky; expresivita

Temporální logika vnořených volání a výnosů; Alur, Etessami, a Madhusudan; Tacas 2004.
Pravidelné jazyky vnořených slov : Pevný bod, automatů a synchronizaci; Arenas, Barcelo, a Libkin; ICALP 2007.
Prvního řádu a temporální logiky pro vnořené slovy, Alur, Arenas, Barcelo, Etessami, Immerman a Libkin; LICS 2007.
Střídavý automaty a časové Fixpoint kalkul pro viditelně zásobníkovými jazyků; Bozzelli; Shodují 2007.
Gramatická reprezentace viditelně zásobníkovými jazyků; Baran a Barringer; WoLLIC 2007.
Vážené logiky pro vnořených slov a algebraické formální mocninné řady; Matissen; ICALP 2008.

Specifikace pro analýzu programu

Aspekty VPA bázi : Lepší podpora pro AOP přes protokoly; Nguyen a Sudholt; SEFM 2006.
Instrumenting C programy s vnořenými slov sleduje; Chaudhuri a Alur; SPIN 2007.
Syntetizovat monitory pro bezpečnostní vlastnosti – tentokrát s hovory a výnosů; Rosu, Chen a míč; RV 2008.
Časová úvaha o procesních programů; Alur a Chaudhuri; VMCAI 2010.
Vnořené interpolants; Heizmann, Hoenicke, a Podelski; POPL 2010.
Kontrola kompatibility výrobce a spotřebitele; Drscoll, Burton, a opakování; FSE 2011.
Bezpečné programování přes viditelně zásobníkovými bezpečnostních hry; Harris Jha, a opakování; CAV 2012.
OpenNWA :vnořené slovo automat knihovna; Driscoll, Thákur, a opakování; CAV 2012.

XML zpracování a stromů automaty

Viditelně zásobníkové výraz efekty pro zpracování XML proudu; džbán; PLAN – X 2005.
Viditelně zásobníkové jazyky pro streaming XML; Kumar, Madhusudan, a Viswanathan; WWW 2007.
Svatba slova a stromy; Alur; PODS 2007.
Přepisování viditelně zásobníkovými jazyků pro integraci dat XML; Thomo a Venkatesh; CIKM 2008.
Streamování stromové automaty; Gauwin, Niehren, a Roos; Informace o zpracování Letters 2009.
Nejstarší dotaz záznamník pro deterministické vnořené word automatů; Gauwin, Niehren, a Tison; FCT 2009.
Query automaty pro vnořené slova; Madhusudan a Viswanathan; MFCS 2009.
Od regulárních výrazů do vnořených slovy : Sjednocení jazyků a provádění dotazů pro relační a XML sekvencí; Mozafárí, Zeng, Zaniolo; VLDB 2010.
Vysoce výkonný komplexní zpracování událostí během toku XML; Mozafárí, Zeng, Zaniolo; SIGMOD 2012.
Streamable fragmenty dopředu XPath; Gauwin a Niehren; CIAA 2012.
Brzy XPath výběr uzlu proudy XML; Debarbieux, Gauwin, Niehren, Sebastian, a Zergaoui; 2012.

Převodníky

Viditelně zásobníkové převodníky pro orientační ověření streaming XML; Thomo, Venkatesh, a Ye; Foiks 2008.
Viditelně zásobníkové převodníky; Raskin a Servais; ICALP 2008.
Rovnocennost deterministických vnořené Word do aplikace Word převodníky; Staworko, Laurence, Lemay, Niehren; FCT 2009.
Vlastnosti viditelně zásobníkových převodníky; E. Filiot, J.-F. Raskin, P.-A. Reynier, F. Servais a J.-M. Talbot; MFCS 2010.
XEvolve :XML Schema Evolution rámec; F. Picalausa, F. Servais a E. Zimаnyi; SACSVT 2011.
Přehrávání po síti z vnořené Word Transductions; E. Filiot, O. Gauwin, P.-A. Reynier, F. Servais. FSTTCS 2011.
Streamování stromové převodníky; R. Alur a L. D’ Antoni; ICALP 2012.
Viditelně Zásobníkové převodníky s look-ahead. E. Filiot a F. Servais. SOFSEM 2012.

Vnořené Stromy

O pevném bodě počet pro místní a globální programu toků; Alur, Chaudhuri, a Madhusudan; POPL 2006.
Jazyky vnořených stromů; Alur, Chaudhuri, a Madhusudan; CAV 2006.
Viditelně zásobníkové jazyky a termín přepisování; Chabin a Rety; FroCos 2007.
Viditelně Tree Automaty s pamětí a omezení; Comon – Lundh, Jacquemard, Perrin; Logické metody v informatice 2008.

Slova s více Nestings

Poznámka o vnořených slov; Blass a Gurevič; Microsoft Research TR; 2006.
Robustní Třída kontextových jazyků; La Torre, Madhusudan, a Parlato; LICS 2007.
2 – Viditelně zásobníkové automaty; Carotenuto, Murano, a Peron; DLT 2007.
Realizovatelnosti souběžných rekurzivních programů; Bollig, Grindei, a Habermehl; FoSSaCS 2009.

Nové výsledky pomocí viditelnost volání / Vrácení

Třetího řádu Idealizovaný Algol s iteraci je decidable; Murawski a Walukiewicz; FoSSaCS 2005.
Synchronizace zásobníkových automatů; Caucal; DLT 2006.
Výroková logika dynamický s rekurzivních programů; Plnicí a Serre; FoSSaCS 2006.
Výška deterministický zásobníkový automat; Nowotka a Srba; MFCS 2007.
Nekonečný automat charakteristika dvojitého exponenciálního času; La Torre, Madhusudan, a Parlato; CSL 2008.

Náročné otevřený problém
Zvažte následující rozhodovací problém : vzhledem k tomu dva regulární jazyky L1 a L2 vnořených slov, to, že existují regulární jazyk R slov nad abecedou označili tak, že průsečík ( R, L1 ) se rovná L2? To není známo, že by decidable, i pro speciální případ, že L1 jemnožina všech dobře uzavřeno slovy. Motivace jenásledující : obecně, aby zjistil, zdavstup patří do L2,stroje na zpracování potřebuje stack. Ale předpokládejme, že už máte nějaké další poznatky o vstupu, že to patří k nastavené L1 ( například, můžeme vědět, ževstup je dobře uzavřeno ), mohou tyto znalosti použít k sestrojení DFA A takové, že pro vstupy na L1,je schopen rozhodnout, členství v L2. Tento problém je inspirován papíru ” ověřování streaming XML dokumenty ” od Segoufin a Vianu, lusky z roku 2002, který také představuje částečné řešení.

Comments are closed.