shithub: hugo

--- a/transform/absurlreplacer.go

+++ b/transform/absurlreplacer.go

@@ -37,11 +37,6 @@

 	tHrefdq

 	tSrcsq

 	tHrefsq

-	// guards

-	tGrcdq

-	tGhrefdq

-	tGsrcsq

-	tGhrefsq

 type contentlexer struct {

@@ -130,24 +125,6 @@

},

-func replace(content []byte, matchers []absurlMatcher) *contentlexer {

-	var items []item

-	if x := itemSlicePool.Get(); x != nil {

-		items = x.([]item)[:0]

-		defer itemSlicePool.Put(items)

-	} else {

-		items = make([]item, 0, 8)

-	}

-	lexer := &contentlexer{content: content,

-		items:        items,

-		prefixLookup: &prefixes{pr: mainPrefixRunes},

-		matchers:     matchers}

-	lexer.runReplacer()

-	return lexer

-}

 func (l *contentlexer) runReplacer() {

 	for l.state = lexReplacements; l.state != nil; {

 		l.state = l.state(l)

@@ -156,11 +133,8 @@

 type absurlMatcher struct {

 	replaceType itemType

-	guardType   itemType

 	match       []byte

-	guard       []byte

 	replacement []byte

-	guarded     bool

 func (a absurlMatcher) isSourceType() bool {

@@ -207,24 +181,21 @@

 	isSource := l.prefixLookup.first == 's'

 	for _, m := range l.matchers {

-		if m.guarded {

-			continue

-		}

 		if isSource && !m.isSourceType() || !isSource && m.isSourceType() {

 			continue

-		s := l.content[l.pos:]

-		if bytes.HasPrefix(s, m.guard) {

-			if l.pos > l.start {

-				l.emit(tText)

+		if bytes.HasPrefix(l.content[l.pos:], m.match) {

+			// check for schemaless urls

+			posAfter := pos(int(l.pos) + len(m.match))

+			if int(posAfter) >= len(l.content) {

+				return

-			l.pos += pos(len(m.guard))

-			l.emit(m.guardType)

-			m.guarded = true

-			return

-		} else if bytes.HasPrefix(s, m.match) {

+			r, _ := utf8.DecodeRune(l.content[posAfter:])

+			if r == '/' {

+				// schemaless: skip

+				return

+			}

 			if l.pos > l.start {

 				l.emit(tText)

@@ -240,31 +211,30 @@

 	b := bp.GetBuffer()

 	defer bp.PutBuffer(b)

-	guards := make([]bool, len(matchers))

-	replaced := replace(content, matchers)

-	// first pass: check guards

-	for _, item := range replaced.items {

-		if item.typ != tText {

-			for i, e := range matchers {

-				if item.typ == e.guardType {

-					guards[i] = true

-					break

-				}

-			}

-		}

+	var items []item

+	if x := itemSlicePool.Get(); x != nil {

+		items = x.([]item)[:0]

+		defer itemSlicePool.Put(items)

+	} else {

+		items = make([]item, 0, 8)

-	// second pass: do replacements for non-guarded tokens

-	for _, token := range replaced.items {

+	lexer := &contentlexer{content: content,

+		items:        items,

+		prefixLookup: &prefixes{pr: mainPrefixRunes},

+		matchers:     matchers}

+	lexer.runReplacer()

+	for _, token := range lexer.items {

 		switch token.typ {

 		case tText:

 			b.Write(token.val)

 		default:

-			for i, e := range matchers {

-				if token.typ == e.replaceType && !guards[i] {

+			for _, e := range matchers {

+				if token.typ == e.replaceType {

 					b.Write(e.replacement)

-				} else if token.typ == e.replaceType || token.typ == e.guardType {

-					b.Write(token.val)

+					break

@@ -286,16 +256,10 @@

 	dqHtmlMatch := []byte("\"/")

 	sqHtmlMatch := []byte("'/")

-	dqGuard := []byte("\"//")

-	sqGuard := []byte("'//")

 	// XML

 	dqXmlMatch := []byte("&#34;/")

 	sqXmlMatch := []byte("&#39;/")

-	dqXmlGuard := []byte("&#34;//")

-	sqXmlGuard := []byte("&#39;//")

 	dqHtml := []byte("\"" + base + "/")

 	sqHtml := []byte("'" + base + "/")

@@ -303,15 +267,15 @@

 	sqXml := []byte("&#39;" + base + "/")

 	return &absurlReplacer{htmlMatchers: []absurlMatcher{

-		{tSrcdq, tGrcdq, dqHtmlMatch, dqGuard, dqHtml, false},

-		{tSrcsq, tGsrcsq, sqHtmlMatch, sqGuard, sqHtml, false},

-		{tHrefdq, tGhrefdq, dqHtmlMatch, dqGuard, dqHtml, false},

-		{tHrefsq, tGhrefsq, sqHtmlMatch, sqGuard, sqHtml, false}},

+		{tSrcdq, dqHtmlMatch, dqHtml},

+		{tSrcsq, sqHtmlMatch, sqHtml},

+		{tHrefdq, dqHtmlMatch, dqHtml},

+		{tHrefsq, sqHtmlMatch, sqHtml}},

 		xmlMatchers: []absurlMatcher{

-			{tSrcdq, tGrcdq, dqXmlMatch, dqXmlGuard, dqXml, false},

-			{tSrcsq, tGsrcsq, sqXmlMatch, sqXmlGuard, sqXml, false},

-			{tHrefdq, tGhrefdq, dqXmlMatch, dqXmlGuard, dqXml, false},

-			{tHrefsq, tGhrefsq, sqXmlMatch, sqXmlGuard, sqXml, false},

+			{tSrcdq, dqXmlMatch, dqXml},

+			{tSrcsq, sqXmlMatch, sqXml},

+			{tHrefdq, dqXmlMatch, dqXml},

+			{tHrefsq, sqXmlMatch, sqXml},

}}

--- a/transform/chain_test.go

+++ b/transform/chain_test.go

@@ -21,6 +21,12 @@

 const REPLACE_1 = "No replacements."

 const REPLACE_2 = "ᚠᛇᚻ ᛒᛦᚦ ᚠᚱᚩᚠᚢᚱ\nᚠᛁᚱᚪ ᚷᛖᚻᚹᛦᛚᚳᚢᛗ"

+// Issue: 816, schemaless links combined with others

+const REPLACE_SCHEMALESS_HTML = `Pre. src='//schemaless' src='/normal'  <a href="//schemaless">Schemaless</a>. <a href="/normal">normal</a>. Post.`

+const REPLACE_SCHEMALESS_HTML_CORRECT = `Pre. src='//schemaless' src='http://base/normal'  <a href="//schemaless">Schemaless</a>. <a href="http://base/normal">normal</a>. Post.`

+const REPLACE_SCHEMALESS_XML = `Pre. src=&#34;//schemaless&#34; src=&#34;/normal&#34;  <a href=&#39;//schemaless&#39;>Schemaless</a>. <a href=&#39;/normal&#39;>normal</a>. Post.`

+const REPLACE_SCHEMALESS_XML_CORRECT = `Pre. src=&#34;//schemaless&#34; src=&#34;http://base/normal&#34;  <a href=&#39;//schemaless&#39;>Schemaless</a>. <a href=&#39;http://base/normal&#39;>normal</a>. Post.`

 var abs_url_bench_tests = []test{

 	{H5_JS_CONTENT_DOUBLE_QUOTE, CORRECT_OUTPUT_SRC_HREF_DQ},

 	{H5_JS_CONTENT_SINGLE_QUOTE, CORRECT_OUTPUT_SRC_HREF_SQ},

@@ -34,8 +40,10 @@

 var sanity_tests = []test{{REPLACE_1, REPLACE_1}, {REPLACE_2, REPLACE_2}}

-var abs_url_tests = append(abs_url_bench_tests, sanity_tests...)

-var xml_abs_url_tests = append(xml_abs_url_bench_tests, sanity_tests...)

+var extra_tests_html = []test{{REPLACE_SCHEMALESS_HTML, REPLACE_SCHEMALESS_HTML_CORRECT}}

+var abs_url_tests = append(abs_url_bench_tests, append(sanity_tests, extra_tests_html...)...)

+var extra_tests_xml = []test{{REPLACE_SCHEMALESS_XML, REPLACE_SCHEMALESS_XML_CORRECT}}

+var xml_abs_url_tests = append(xml_abs_url_bench_tests, append(sanity_tests, extra_tests_xml...)...)

 func TestChainZeroTransformers(t *testing.T) {

 	tr := NewChain()