Таким образом, как можно понять из вышеописанного, возникает большое количество дублей. Мои предположения, как можно решить эту проблему (само-собой, это не касается страниц, у которых уникальный контент на соответствующем языке):
1) в идеале, создать уникальный контент на нужном языке на каждой странице для каждой языковой версии, однако сайт объёмный, это может занять большое количество времени, и так или иначе нужно найти хотя бы временное решение для избежания дублей;
2) прописать тег rel="canonical" с ссылкой на изначальную версию сайта (оставлять тег до тех пор, пока не будет написан уникальный контент для той или иной страницы). Однако, если делать таким образом, стоит ли убирать атрибуты hreflang с каждой страницы, где будет прописана каноническая ссылка?
3) возможно, оставить всё как есть и не париться? То есть, само-собой, лучше заменить контент на уникальный и на нужном языке, однако согласно рекомендаций Google, атрибуты hreflang могут использоваться в случаях, когда переведены только части шаблона, а основной контент остаётся на одном и том же языке для разных языковых версий – . Правильно ли я понимаю это? Однако, так или иначе, все возможные сервисы аудита, видят все эти страницы как дубли, потому такой вариант смущает.
4) прописать тег noindex,nofollow, на каждой странице с дублированным контентом (опять таки, оставлять тег до тех пор, пока не будет написан уникальный контент на нужном языке). И тут снова вопрос по поводу атрибутов hreflang – нужно ли при этом убирать все эти атрибуты со страниц, закрытых от индексации?
Вот такие мои предположения, но не могу решить как сделать грамотней всего, чтобы не навредить сайту. Пожалуй, больше всего склоняюсь к варианту с временными каноническими ссылками до тех пор, пока не будет написан уникальный контент для всех страниц на нужном языке, но как тогда быть с атрибутом hreflang?
Еще хочу обратить внимание на другую проблему, связанную с разными языковыми версиями. Основной язык сайта – английский. При этом, у сайта есть субдиректория /en, которая вообще ничем не отличается (то есть, оригинальная версия сайта www."домен".com и www."домен".com/en абсолютно одинаковые по контенту). И что самое интересное, страницы субдиректории /en ранжируются в Google гораздо лучше, нежели оригинальная версия сайта без субдиректории. Думаю, здесь, в любом случае, стоит применить тег rel="canonical", но так как показатели страниц субдиректории /en гораздо лучше, то сделать именно эти страницы каноничными. Будет ли такое решение разумным?
Надеюсь, смог объяснить суть возникших проблем и буду рад за любой совет и помощь. Заранее спасибо!