Utdrag från "monolog" mellan mig och mos
19/09,22:45:27 < johan> mos: kollade ditt regex... vad jag kan se funkar den med ankarlänkar
19/09,22:45:32 < johan> (#something)
19/09,22:45:55 < johan> men jag gjorde en iaf:
- Kod: Markera allt
(?<!href="|href=)(https?://)([\w\-]+\.)?([\w\-]+\.\w+)[^,^\.^\s]*
19/09,22:46:09 < johan> jämförde dem (regex:en) på ett antal varierande länkar och de mynnade ut i samma resultat
19/09,22:47:00 < johan> förutom redan existerande länkar i följande format <a href=http://stuff.se>stuff</a> (dvs href="URL" men utan "" alltså bara href=URL)
19/09,22:47:32 < johan> och om man känner för att leva lite on the edge så kan man sätta ett frågetecken efter (https?://)
19/09,22:47:42 < johan> så det blir
- Kod: Markera allt
(?<!href="|href=)(https?://)?([\w\-]+\.)?([\w\-]+\.\w+)[^,^\.^\s]*
19/09,22:47:52 < johan> då tar den även länkar utan http[s]://
19/09,22:48:28 < johan> men då tar den ju även existerande länkar i <a href eftersom lookbehind på href=" inte gäller längre (eftersom den lookbehind var associerad med (https?://) )
19/09,22:48:43 < johan> samt att den tar allt.vadsomhelst
19/09,22:48:48 < johan> så t.ex. domain.local matchas (t.ex hade också matchat)
19/09,22:48:59 < johan> även tal som t.ex 152.34
19/09,22:49:04 < johan> avvägning som gäller