Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Провести эксперименты по построению сжатых представлений данных и графов #63

Open
Anaxagor opened this issue May 20, 2024 · 5 comments
Assignees

Comments

@Anaxagor
Copy link

No description provided.

@Anaxagor
Copy link
Author

Проверка гипотезы о том, что близкие в пространстве сжатых представлений данные будут облазать близкими каузальными структурами.

@jrzkaminski
Copy link

Эксперименты по теме находятся в этом репозитории, комментарии по результатам будут в ридми
https://github.com/jrzkaminski/meta-graphs

@Anaxagor
Copy link
Author

  1. Задача - разобраться со статье "Geometric Dataset Distances via Optimal Transport" и на ее основе реализовать алгоритм вычисления расстояний между датасетами.
  2. Также сравнить другие методы вычисления расстояния между датасетами, которые указаны в обзоре в статье "Geometric Dataset Distances via Optimal Transport".

@Anaxagor
Copy link
Author

  1. Провести анализ литературы на предмет вычисления расстояний между табличными датасетами, какие здесь вообще есть подходы?
  2. Провести анализ литературы на тему вычисления расстояний между графами, какие здесь есть подходы?
  3. Провести эксперименты по тому, как расстояние emd реагирует на изменения в структурах. Тут можно рассмотреть как изменение структуры при фиксированных распределениях и функциональных зависимостях, так и изменения распределений и функциональных зависимостей при фиксированной структуры, так и смешанных случай.
  4. Разобраться в том, как работает emd, уметь его объяснить.
  5. Реализовать расчет расстояния из "Geometric Dataset Distances via Optimal Transport". Проверить его также на предмет того, как оно реагирует на изменения в структуре.

@jrzkaminski
Copy link

  1. Проверить зависимость emd от количества удаленных из графа узлов.
  2. Использовать расстояния между матрицами ковариаций как метрику различия датасетов.
  3. Реализовать метод из статьи, где вместо показателей производительности моделей будут использоваться характеристики датасетов.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants